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OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



Searched: 



October 15, 2004, 15:11:57 ; Search time 3296.03 Seconds 

(without alignments) 
10265.033 Million cell updates/sec 

US-10-070-532-5 
1133 

1 atggagccctcagccacccc tcctgaccatcgtgccccgg 1133 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



27513289 seqs, 14931090276 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



55026578 



Post-processing: 



Database 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

EST:* 



1 
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22 
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24 
25 
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27 



em_estba : * 
em_esthum: * 
em_estin: * 
em_estmu: * 
em_estov: * 
em_estpl : * 
em__estro : * 
em_htc : * 
gb_estl : * 
gb_est2:* 
gb_htc: * 
gb_est3: * 
gb__est4 : * 
gb_est5 : * 
em_estfun: * 
em_estom: * 
em_gss_hum: * 
em_gss_inv: * 
em_gss_pln: * 
em_gss_vrt : * 
em_gss_fun: * 
em_gss_mam: * 
em_gss__mus : * 
em_gss_pro: * 
em_gss_rod: * 
em_gss_phg : * 
em_gss_vrl : * 



28: gb_gssl:* 
29: gb_gss2:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or, equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 





No. 


Score 


Match Length 


DB 


ID 


Description 




1 


715.2 


63. 


1 


1740 


11 


BC035686 


BC035686 


Homo sapi 


c 


2 


701. 4 


61. 


9 


886 


13 


BX433093 


BX433093 


BX433093 


c 


3 


659.2 


58. 


2 


899 


13 


BX433092 


BX433092 


BX433092 




4 


561. 4 


49. 


5 


753 


29 


AY420885 


AY420885 


Homo sapi 




5 


530.4 


46. 


8 


3470 


11 


AK048781 


AK048781 


Mus muscu 




6 


530.4 


46. 


8 


3729 


11 


AK038551 


AK038551 


Mus muscu 




7 


519.8 


45. 


9 


1790 


11 


BC035858 


BC035858 


Homo sapi 




8 


519.4 


45. 


8 


3153 


11 


AK079572 


AK079572 


Mus muscu 


c 


9 


504.4 


44. 


5 


790 


14 


CF147830 


CF147830 


AGENCOURT 




10 


474.2 


41. 


9 


750 


29 


AY420886 


AY420886 


Pan trogl 




11 


472 


41. 


7. 


1001 


9 


AL535838 


AL535838 AL535838 




12 


468.6 


41. 


4 


726 


29 


AY420887 


AY420887 


Mus muscu 




13 


393.2 


34. 


7 


993 


12 


BM926746 


BM926746 


AGENCOURT 




14 


374 . 6 


33. 


1 


543 


13 


BX119589 


BX119589 


BX119589 




15 


367 


32. 


4 


788 


14 


CF147829 


CF147829 


AGENCOURT 




16 


329.2 


29. 


1 


382 


12 


BQ042116 


BQ042116 


sheepl Sh 


c 


17 


296 


26. 


1 


525 


12 


BI133700 


BI133700 


UI-M-BH3- 




18 


285. 4 


25. 


2 


635 


12 


BM939496 


BM939496 


UI-M-BH3- 




19 


278 . 4 


24. 


6 


520 


13 


BQ269289 


BQ269289 


ik23fl2.y 




20 


265. 8 


23. 


5 


627 


10 


BB632359 


BB632359 


BB632359 




21 


265.4 


23. 


4 


599 


12 


BM933820 


BM933820 


UI-M-BH3- 




22 


263.2 


23. 


2 


611 


13 


BY723922 


BY723922 


BY723922 




23 


249 


22. 


0 


892 


13 


BX409735 


BX409735 


BX409735 




24 


216.8 


19. 


1 


477 


12 


BM087401 


BM087401 


500158 MA 




25 


202 . 4 


17. 


9 


662 


10 


BB632883 


BB632883 


BB632883 


c 


26 


198 . 4 


17. 


5 


625 


13 


BQ285933 


BQ285933 


ik23fl2.x 




27 


198.2 


17. 


5 


1073 


12 


BM920548 


BM920548 


AGENCOURT 




28 


197 . 6 


17. 


4 


505 


10 


BB651179 


BB651179 


BB651179 




29 


196 . 8 


17. 


4 


245 


12 


BI976482 


BI976482 


485407 MA 




30 


186 . 2 


16. 


4 


464 


13 


BY239887 


BY239887 


BY239887 




31 


175.4 


15. 


5 


444 


14 


R55704 


R55704 yg88hl0.rl 


c 


32 


165.8 


14. 


6 


703 


29 


CE375359 


CE375359 


tigr-gss- 




33 


163.2 


14. 


4 


1290 


29 


AY411591 


AY411591 


Homo sapi 




34 ' 


162 


14. 


3 


721 


29 


CE235359 


CE235359 


tigr-gss- 




35 


157.8 


13. 


9 


1296 


29 


AY411593 


AY411593 


Mus muscu 


c 


36 


156.2 


13. 


8 


1013 


9 


AL535837 


AL535837 AL535837 




37 


147.2 


13. 


0 


768 


13 


BX109847 


BX109847 


BX109847 




38 


133 


11. 


7 


257 


10 


AW427900 


AW427900 


64510 MAR 


c 


39 


127.2 


11. 


2 


1005 


28 


CC212654 


CC212654 


CH261-75F 


c 


40 


127.2 


11. 


2 


1058 


28 


CC297061 


CC297061 


CH261-177 


c 


41 


122.4 


10. 


8 


1194 


28 


CC279941 


CC279941 


CH261-24C 




42 


120.2 


10. 


6 


526 


29 


CG978334 


CG978334 


CH240_169 




43 


119 


10. 


5 


1113 


29 


AY420480 


AY420480 


Homo sapi 




44 


117.8 


10. 


4 


1100 


29 


AY420481 


AY420481 


Pan trogl 




45 


108.8 


9. 


6 


1113 


29 


AY420482 


AY420482 


Mus muscu 



ALIGNMENTS 



RESULT 1 
BC035686 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



FEATURES 

source 



BC035686 1740 bp mRNA linear HTC 20-SEP-2.002 

Homo sapiens , Similar to hypocretin (orexin) receptor 1, clone 
IMAGE: 5750551, mRNA. 
BC035686 

BC035686. 1 GI: 23242909 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1740) 
Strausberg, R. 
Direct Submission 

Submitted ( 31- JUL-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 

Contact: MGC help desk 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: National Institutes of Health Intramural 

Sequencing Center (NISC) , 

Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri.nih.gov 

Akhter,N., Ayele,K., Beckstrom-Sternberg, S .M. , Benjamin, B., 
Blakesley, R.W. , Bouf f ard, G . G . , Breen,K., Brinkley,C, Brooks, S., 
Dietrich, N. L. , Granite, S., Guan,X., Gupta, J., Haghighi, P . , 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro, Q. L. , Masiello, C. , Maskeri, B. , Mastrian, S . D. , McCloskey, J. C . , 
McDowell, J. , Pearson, R. , Stantripop, S . , Thomas, P. J., Touchman, J. W. , 
Tsurgeon,C, Vogt,J.L., Walker, M. A., Wetherby, K. D. , Wiggins, L., 
Young, A., Zhang, L.-H. and Green, E.D. 

Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 79 Row: m Column: 17 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi: 4557636 
This clone has the following problem: frame shifted. 

Location/Qualifiers 

1. .1740 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone=" IMAGE: 5750551" 

/tissue_type="Lung, Spleen, fetal, pooled" 



/clone_lib="NIH_MGC_122 n 
/lab_host-"DH10B" 
/note="Vector: pCMV-SPORT6" 

ORIGIN 

Query Match 63.1%; Score 715.2; DB 11; Length 1740; 

Best Local Similarity 83.3%; Pred. No. 4.8e-139; 

Matches 906; Conservative 0; Mismatches 3; Indels 179; Gaps 1; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 506 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 565 

Qy 61 TCCCCTGTGCCTC C AGACT AT GAAGAT GAGTT T CT C C GCT AT CT GT G GC GT GAT TAT CT G 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 566 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGCGATTATCTG 625 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 626 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCG 685 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 
I I I I I I I I I I I I I I I I I I 

Db 686 CTGGTGGGCAACACGCTG : 7 03 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Db 704 703 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Db 704 703 

Qy 361 GT CAT C CC CT AT CT ACAGGCT GT GT C C GT GT C AGT G GC AGT G CT AACT CT C AGCTT CAT C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 704 GGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 74 6 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 747 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 806 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8 07 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 866 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 867 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 926 

Qy 601 GT CT GT GAT GAACGCT GGGCAGAT GAC CT CT AT CC CAAGAT CT AC C AC AGT T GCTT CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 927 GT CTGT GATGAACGCTGGGCAGATGACCTCTATCCCAAGAT CTACCACAGTT GCTT CTTT 986 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 987 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 104 6 



Qy 721 

Db 1047 



780 
1106 



Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I ! I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1107 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGCC 1166 

Qy 841 CGCGCCTT C CT GGCT GAAGT GAAGCAGATGCGT GCACGGAGGAAGACAGCCAAGAT GCT G 900 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1167 CGCGCCTTC CT GGCT GAAGT GAAGCAGATGCGT GCACGGAGGAAGACAGCCAAGAT GCT G 1226 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1227 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1286 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1287 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1346 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1347 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1406 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1407 CTCAGTGG 1414 



RESULT 2 

BX433093/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX433093 886 bp mRNA linear EST 15-MAY-2003 

BX433093 Homo sapiens FETAL BRAIN Homo sapiens cDNA clone 
CS0DF013YE04 3-PRIME, mRNA sequence. 
BX433093 

BX433093.1 GI: 30779168 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 886) 
Li,W.B., Gruber,C 



and Polayes,D, 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact:: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 151. r For 
more information about this cluster, see 
http://www.genoscope.cns.fr/ 

cgi-bin/cluster.cgi?seq=CS0BAI011ZB01_CS00962_2&cluster=151.r . 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0BAI011ZB01_CS00962_2 . 



FEATURES Location/Qualifiers 
source 1. .886 



/organisrn="Homo sapiens" 
/mol_type="mRNA M 
/db_xref="taxon: 9606" 
/clone="CS0DF013YE04" 
/tissue_type="FETAL BRAIN" 
/dev_stage=" fetal" 

/clone_lib="Homo sapiens FETAL BRAIN" 

/note="Organ: brain; Vector: pCMVSPORT_6; 1st strand cDNA 
was primed with a Notl-oligo (dT) primer. Five prime end 
enriched, double-strand cDNA was digested with Not I and 
cloned into the Not I and EcoRV sites of the pCMVSPORT 6 
vector. Library was not normalized." 



ORIGIN 



Query Match 61.9%; Score 701.4; DB 13; Length 886; 

Best Local Similarity 99.0%; Pred. No. 2.8e-136; 

Matches 705; Conservative 0; Mismatches 7; Indels 0; Gaps 0; 

Qy 377 AGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGT 436 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 745 AGGCTGTGTCCGTGTCAGTGACAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGT 686 

Qy 437 ATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCC 496 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 685 ATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATNC 626 

Qy 497 TGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCA 556 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 625 TGGGCATCTGGCCTGTGTCGCTGGCCATCATGGTGCCCAGGGCTGCAGTCATGCAATGCA 566 

Qy 557 GCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCT 616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 565 GCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCT 506 

Qy 617 G GGC AGAT GAC CT CT AT CC CAAGAT CT AC CACAGTT GCTT CTT T ATT GT C AC CTAC CT GG 676 

I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 505 GGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGG 44 6 

Qy 677 CCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCC 736 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 445 CCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCC 386 

Qy 737 AGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGG 796 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I i.l I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 385 AGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGG 326 

Qy 797 GGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTG 856 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 325 GGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGCCCGCGCCTTCCTGGCTG 266 

Qy 857 AAGT GAAGCAGAT GC GT GCACGGAGGAAGACAGC CAAGAT GCT GATGGT GGT GCT GCT G G 916 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 265 AAGT GAAGCAGAT GCGT GCACGGAGGAAGACAGC CAAGAT GCT GATGGT GGT GCT GCT GG 206 



Qy 



917 



TCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGA 976 



Db 205 TCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGA, 14 6 

Qy 977 TGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGC 1036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 145 TGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGC 8 6 

Qy 1037 T GGT GT AC GC CAACAGC GCT GCCAAC C CC AT CAT CT ACAACTT C CT C AGT GG 1088 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db . 85 TGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTCCTCAGTGG 34 



RESULT 3 

BX433092/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX433092 899 bp mRNA linear EST 15-MAY-2003 

BX433092 Homo sapiens FETAL BRAIN Homo sapiens cDNA clone 
CS0DF013YE04 3-PRIME, mRNA sequence. 
BX433092 

BX433092.1 GI: 30779167 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota; Metazoa; 
Mammalia; Eutheria; 
1 (bases 1 to 899) 
Li,W.B. , Gruber,C. , 



FEATURES 

source 



Chordata; Craniata; Vertebrata; Euteleostomi ; 
Primates; Catarrhini; Hominidae; Homo. 



ORIGIN 



Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 151. r For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CSOBAI011ZB01_CS00962_l&cluster=151 . r. 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CSOBAI011ZB01_CS00962_1 . 

Location/Qualifiers 

1. .899 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
■ ■ /clone="CS0DF013YE04" •■ ; - ■ 

/tissue_type="FETAL BRAIN" 
/dev_stage=" fetal" 

/clone_lib="Homo sapiens FETAL BRAIN" 

/note="0rgan: brain; Vector: pCMVSP0RT_6; 1st strand cDNA 
was primed with a Notl-oligo (dT) primer. Five prime end 
enriched, double-strand cDNA was digested with Not I and 
cloned into the Not I and EcoRV sites of the pCMVSPORT 6 
vector. Library was not normalized." 



Query Match 



58.2%; Score 659.2; DB 13; Length 899; 



Best Local Similarity 94.4%; Pred. No. 1.9e-127; 

Matches 693; Conservative 0; Mismatches 40; Indels 1; Gaps 1; 



Qy 372 TCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCG 431 

I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I III 

Db 738 TGTAAGNNGTGTGTCGTGTTCAGTGGCAGTGCTACTTCTCAGCTTCATCGCCTGGACCCG 679 

Qy 432 CTGGTATGCCATC-TGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCT 490 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 678 CTGGTATGCCATCATCCCACCCACTATTGTCAAAGAGCACAGCCCGGCGGGCCCGTGCTC 619 

Qy 491 CCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGG 550 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I II 
Db 618 CCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGG 559 

Qy 551 AATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATG 610 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 558 AATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATG 499 

Qy 611 AACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCT 670 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 4 98 AAC GCT GGG C AGAT GACCT CT AT CC CAAGAT CT AC CAC AGTT GCT T CTTT AT T GT CAC CT 439 

Qy 1 671 ACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGG 730 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 438 ACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGG 379 

Qy 731 GCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACC 790 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 378 GCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACC 319 

Qy 7 91 AGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCC 850 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 318 AGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGCCCGCGCCTTCC 259 

Qy 851 T GGCT GAAGT GAAGCAGAT G C GT GCAC GGAGGAAGACAGC CAAGAT GCT GAT GGTGGT GC 910 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 258 TGGCT GAAGT GAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGAT GCTGAT GGTGGT GC 199 

Qy 911 TGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGT 970 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 198 TGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGT 139 

Qy 971 TCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCC 1030 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 138 TCGGGATGTTCCGCCAAGCSAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCC 79 

Qy 1031 ACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTCCTCAGTGGAT 1090 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 

Db 78 ACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTCAACTTCCTCAGGTGCAA 19 

Qy 1091 GTAAAGAGAAGAGT 1104 

I III III 
Db 18 ATTCCGGGAGCAGT 5 



RESULT 4 



AY420885 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



AY420885 753 bp DNA linear GSS 17-DEC-2003 

Homo sapiens HCRTR1 gene,, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY420885 

AY420885. 1 GI: 39776842 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 753) 

Clark, A. G. , Glanowski , S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B . , 
Ferriera,S., Wang,G., Zheng,X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 753) 

Clark, A. G., Glanowski , S . , Nielson,R., Thomas,?., Kej ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Car gill, M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence as made by sequencing genomic exons and ordering them 
based on alignment. 

Location/ Qualifiers 

1. .753 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9606" 
<1. .>753 
/gene="HCRTRl" 
/locus_tag="HCM7373" 



ORIGIN 



Query Match 4 9.5%; 

Best Local Similarity 99.8%; 
Matches 562; Conservative 



Score 561.4; DB 29; Length 753; 
Pred. No. 5.3e-107; 
0; Mismatches 1; Indels 0; 



Gaps 



0; 



Qy 



Db 



526 ATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGC 585 

1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 I 1 1 1 I I 1 1 1 I I 1 1 1 1 I I I 1 1 1 ill I 1 1 I I I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 

1 ATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCC'fGAGCTAGCCAACCGC 60 



Qy 

Db 

Qy 

Db 



586 ACACGGCTCTTCTCAGTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTAC 645 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I 

61 ACACGGCT CT T CT CAGT CT GT GAT GAACGCT GGGC AGAT GAC CT CT ATCC CAAGAT CT AC 120 

64 6 CACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTAT 705 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 CACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTAT 180 



Qy 



7 06 TTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTG 765 



Db 181 T T C CAGAT AT T C C GCAAG CT CT GG G G C C GC CAGAT C C C C GGC AC CACCT CAG CACT G GT G 24 0 

Qy 766 CGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAG 825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAG 300 

Qy 826 CCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAG 885 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 
Db 301 CCCCAGCCCCGGGCCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAG 360 

Qy 886 ACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGC 945 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 361 ACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGC 420 

Qy 946 GTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCT 1005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCT 480 

Qy 1006 GTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCC 54 0 

Qy 1066 AT CAT CTACAACTTC CT CAGT GG 1088 

I I I I I I I I I I I I I I I I I II I I I I 
Db 541 ATCATCTACAACTTCCTCAGTGG 563 



RESULT 5 
AK048781 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



AK048781 3470 bp mRNA linear HTC 20-SEP-2003 

Mus musculus 0 day neonate cerebellum cDNA, RIKEN full-length 
enriched library, clone : C230065B06 product : OREXIN RECEPTOR TYPE 2, 
full insert sequence. 
AK048781 

AK048781. 1 GI; 26339571 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y,, Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 



Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M. r Nishine / T., Harada,A., 
Yamamoto, R. , Matsumoto, H . , Sakaguchi, S . , Ikegami, T . , Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J. 
Okazaki,Y., Muramatsu,M. , Inoue,Y. f Kira,A. and Hayashizaki, Y. 

TITLE RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

JOURNAL Genome Res. 10 (11) , 1757-1771 (2000) 

MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 

FANTOM Consortium. 
TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature. 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 3470) 

AUTHORS Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P. 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa,A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y . 

TITLE Direct Submission 

JOURNAL Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc . riken . go . jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL: http : / / f antom. gsc. riken. go . jp/ . 
FEATURES Location/Qualifiers 
source 1. .3470 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db xref=" FANTOM DB : C230065B06" 



CDS 



polyA_signal 
polyA_site 
ORIGIN 



/db_x r e f = "MGI :2415851" 
/db_xref="taxon: 10090" 
/clone="C230065B06" 
/tissue_type= ,, cerebellum ,, 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="0 day neonate" 
75. .1457 

/note="unnamed protein product; OREXIN RECEPTOR TYPE 2 
(SWISSPROT) P56719, evidence: FASTY, 98.5%ID, 100%length, 
match=1380) 
putative " 
/codon_start=l 
/proteinjLd="BAC33457.1" 
/db_xref="GI: 26339572" 

/ translation="MSSTKLEDSLSRRNWSSASELNETQEPFLNPTDYDDEEFLRYLW 

REYLHPKEYEWLIAGYIIVFWALIGNVLVCVAWKNHHMRTWNYFIWLSl^VL 

VTITCLPATLWDITETWFFGQSLCKVIPYLQTVSVSVSVLTLSCIALDRWYAICHPL 

MFKSTAKRARNSIWIWIVSCIIMI PQAIVMECSSMLPGLANKTTLFTVCDEHWGGEV 

YPKMYHICFFLWYMAPLCLMILAYLQIFRKLWCRQIPGTSSWQRKWKQQQPVSQPR 

GSGQQSKARI S AVAAEI KQI RARRKTARMLMWLLVFAI CYLP I S I LNVLKRVFGMFT 

HTEDRETVYAWFTFSHWLVYANSAANPIIYNFLSGKFREEFKAAFSCCLGVHHRQGDR 

LARGRT ST E S RKS LTTQ I SN FDNVS KLS EHWLT S I S TL P AANGAGP LQNW YLQQGVP 

SSLLSTWLEV" 

3455. .3460 

/ note="putative " 

3470 

7 note="putative " 



Query Match 46. 8%; 

Best Local Similarity 71.1%; 
Matches 718; Conservative 



Score 530.4; DB 11; Length 3470; 
Pred. No. 3.3e-100; 
0; Mismatches 286; Indels 6; 



Gaps 



l; 



Qy 



Db 



80 AT GAAGAT GAGTTT CT C C GCT AT CT GT GGC GT GATT AT CT GT ACCCAAAACAGT AT GAGT 139 
I M II M II II II II I I I I I I I II II II I I I I I M I I I I I I I I 
178 ACGACGAGGAATTCCTGCGGTACCTGTGGAGGGAATACCTACACCCGAAAGAATATGAGT 237 



Qy 

Db 

Qy 

Db 



140 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

238 GGGTCCTGATCGCAGGGTATATCATCGTGTTCGTTGTGGCTCTCATCGGGAACGTCCTGG 297 

200 T CT GCCT GGCCGT GT GGCGGAACCACCACAT GAGGACAGT CACCAACTACTTCATT GTCA 259 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

298 TCT GTGT GGCAGT GT GGAAGAACCACCACATGAGGACAGT CACCAACTACTT CATAGTCA 357 



Qy 



Db 



260 



358 



A^CTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACCTTTCCCTAGCAGATGTGCTTGTGACCATCACCTGCCTTCCAGCTACCCTCGTTGTTG 417 



Qy 

Db 

Qy 

Db 



320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 

I I I I I II I I I I I III I II II II I I I I I I I I I I I I I I I II III I I I I I 
418 ACAT C ACT GAGACT T GGT T CT TT GG AC AGT CCCT CT GT AAGGT CATT C CTT AT TTACAGA 477 

380 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I I I I I I I I I III I II II II I I I I I III III I I I I I I I I I I I I I 
478 CTGTGTCAGTGTCTGTGTCTGTTCTT'ACGTTGAGCTGCATTGCCTTGGACCGATGGTACG 537 



Qy 44 0 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 4 99 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 538. C CATTT GT CAC CCT T T GATGTT CAAGAG C ACAGC CAAAC G GGCT C GAAAC AGCAT C GT T G 597 



Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 598 T CAT CT GGAT C GT C T C CT GCAT C AT AAT GAT T CCT CAAGC C ATT GT CAT GGAGT GCAGC A 657 

Qy 560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 658 GCAT GCT CCCT GGC CT AGC CAAT AAGAC C ACCCT CTT T AC AGT AT GT GAT GAACACT GGG 717 

Qy 620 CAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCC 679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 GCGGT GAAGTTT AC C CAAAGAT GT AC CAT AT CT GCT T CT T T CT GGTGACAT ACATGGC AC 777 

Qy 680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

I III I'll III I I I I III I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 778 CT CT GT GT CTT AT GAT ATT GGCTT AT CT C CAAAT AT T C C GT AAACT C T GGT GC CGACAGA 837 

Qy 740 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 838 TTCCCGGAACTTCTTCTGTGGTTCAGAGAAAATGGAAGCAGC AGCAGCCGGTTT 891 



Qy 8 00 ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

II I I I I I II I I I I I I I I I I I I I I I I I 

Db 892 CTCAGCCCCGGGGGTCCGGACAGCAGAGCAAGGCTCGGATTAGCGCTGTTGCTGCTGAGA 951 



Qy 860 T GAAGCAGAT GC GT GCAC GGAG GAAGACAGC CAAGAT GCT GAT GGT G GT GCT GCT GGT CT 919 

I I I I I I I I I II I I I I I I I I I I J I I I I I I I I I I I I I I II II II I I I I I I I 
Db 952 TAAAGCAGATCCGAGCACGAAGGAAAACAGCCCGGATGCTCATGGTTGTACTTCTGGTCT 1011 

Qy 920 TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 979 

I II I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I 

Db 1012 T T GCAAT T T GCTAT CT AC CAAT CAGCAT C CT CAAT GT G CTAAAGAGAGT AT T T GGGAT GT 1071 

Qy 980 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 

II M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1072 T CACACACACGGAAGACAGAGAGACTGT CTATGCTT GGTTCACTTTTT CT CATT GGCTT G 1131 



Qy 1040 TGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTCCTCAGTGGA 1089 

I II I I I I I I I I I I I I I I I I I I II II II II II || I I I M I 
Db 1132 TAT AT GC CAACAGT GCT GCAAAC CCAAT TAT T T ATAATT T T CT TAGT GGA 1181 



RESULT 6 
AK038551 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



AK038551 3729 bp mRNA 

Mus mus cuius adult male hypothalamus cDNA, 
enriched library, clone :A230036M08 product 
full insert sequence. 
AK038551 

AK038551. 1 GI: 26332642 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; 



linear HTC 19-SEP-2003 
RIKEN full-length 
OREXIN RECEPTOR TYPE 2, 



Euteleostomi ; 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 

i . . 1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata, K., 
Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 
Normalization and subtraction of cap-trapper-selected cDNAs to 
prepare full-length cDNA libraries for rapid discovery of new genes 



Genome Res . 
20499374 
11042159 
3 

Shibata, K. , 



10 (10), 1617-1630 (2000) 



Itoh,M., Aizawa,K. 
Konno,H., Akiyama,J., Nishi,K. 
Sumi,N., Ishii,Y., Nakamura,S. 



Nagaoka,S. , Sasaki, N. , Carninci,P. , 
Kitsunai,T., Tashiro,H., Itoh,M., 
Hazama,M., Nishine,T., Harada,A. , 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M.; Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 rnulticapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM -Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3729) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,Af, Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata, K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 
Direct Submission 

Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 



COMMENT 



FEATURES 

source 



CDS 



polyA_signal 
polyA site 



Kanagawa 230-0045, Japan (E-mail : genome-res@gsc . riken . go . jp, 
URL : http : / / genome .gsc. riken . go . jp/ , Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL : http : / / genome. gsc. riken. go. jp/ 
URL: http : / /f antom. gsc. riken. go . jp/ . 

Location/Qualifiers 

1. .3729 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/ db_x r e f = " FANTOM_DB : A2 3 0 0 3 6M0 8 " 

/db_xref="MGI : 2402981" 

/db_xref="taxon: 10090" 

/ cl one- " A2 3 0 0 3 6M0 8 " 

/sex="male" 

/tissue_type="hypothalamus" 

/clone__lib="RIKEN full-length enriched mouse cDNA library" 

/dev_stage="adult" 

76. .1458 

/note="unnamed protein product; OREXIN RECEPTOR TYPE 2 
(SWISSPROTI P56719, evidence: FASTY, 98.5%ID, 100%length, 
match=1380) 
putative" 
/ codon_start=l 
/protein_id="BAC30039. 1" 
/db_xref="GI: 26332643" 

/ translation="MSSTKLEDSLSRRNWSSASELNETQEPFLNPTDYDDEEFLRYLW 
REYLHPKEYEWLIAGYIIVFWALIGNVLVCVAWKNHHMRTVTNYFIVNLSLADVL 
VTITCLPATLWDITETWFFGQSLCKVIPYLQTVSVSVSVLTLSCIALDRWYAICHPL 
MFKSTAKRTVRNSI VVIWIVSCIIMIPQAIVMECSSMLPGLANKTTLFTVCDEHWGGEV 
YPKMYHI CFFLVT YMAPLCLMI LAYLQI FRKLWCRQI PGTS SWQRKWKQQQPVSQPR 
GSGQQSKARISAVAAEIKQIRARRKTARMLMWLLVFAI^ 

HTEDRETVYAWFTFSHWLVYANSAANPIIYNFLSGKFREEFKAAFSCCLGVHHRQGDR 
LARGRTSTESRKSLTTQISNFDNVSKLSEHWLTSISTLP7\ANGAGPLQNWYLQQGVP 
SSLLSTWLEV" 
3712. .3717 
/note="putative" 
3729 

/note="putative" 



ORIGIN 



Query Match 46.8%; 
Best Local Similarity 71.1%; 
Matches 718; Conservative 



Score 530.4; DB 11; 
Pred. No. 3.4e-100; 
0; Mismatches 286; 



Length 3729; 



Indels 



6; Gaps 



1; 



Qy 



Db 



80 ATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTGTACCCAAAACAGTATGAGT 139 

I II II II II II II II 1 1 1 1 1 1 I II II II II 1 1 III I 1 1 1 1 1 1 1 

179 ACGAC GAG GAATT CCTG C GGT AC CT GT G GAGGGAAT AC CT ACAC C C GAAAGAATAT GAGT 238 



Qy 



140 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 
I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I II II I I I I I 



Db 



239 GGGTCCTGATCGCAGGGTATATCATCGTGTTCGTTGTGGCTCTCATCGGGAACGTCCTGG 298 



Qy 200 TCTGCCTGGCCGT GT GGC GGAAC CAC C ACAT GAG GACAGT C AC CAACT ACT TCAT T GT CA 259 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 299 T CT GT GT G GCAGT GTGGAAGAACC AC CACAT GAGGACAGT CAC CAACT AC T T CAT AGT CA 358 

Qy 260 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG , 319 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 359 ACCTTTCCCTAGCAGATGTGCTTGTGACCATCACCTGCCTTCCAGCTACCCTCGTTGTTG 418 

, Qy 320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 

I I I I I I I I I I I I III I II II II I I I I I I I I I I I I I I I II III I I I I I 
Db 419 ACATCACTGAGACTTGGTTCTTTGGACAGTCCCTCTGTAAGGTCATTCCTTATTTACAGA 47 8 

Qy 380 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I I I I I I I I I III I II II II I I I I I Ml Ml I I | I I I I I I I I | | 
Db 479 CTGTGTCAGTGTCTGTGTCTGTTCTTACGTTGAGCTGCATTGCCTTGGACCGATGGTACG 538 

Qy 440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 499 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 CCATTTGTCACCCTTTGATGTTCAAGAGCACAGCCAAACGGGCTCGAAACAGCATCGTTG 598 

Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I M I I I I II II III III I II II II I I I I I I I I I I I I I I I 

Db 599 T CAT C T G GAT CGTCTCCTG CAT C AT AAT GAT T C C T C AAG C CAT T GT CAT G G AGT G C AG C A 658 

Qy 560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 659 GCAT GCTCCCTGGCCTAGCCAATAAGACCACCCT CTTTACAGTAT GTGAT GAACACT GGG 718 

Qy 620 CAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCC 679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 719 GC GGT GAAGT T T AC C CAAAGAT GTAC CAT AT CTGCTTCTTTCTGGT GAC AT AC ATGGCAC 778 

Qy 680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

I IN I M III I I I I III I I I I I I I I I I I I II I I II I I I I I I I I I I 

Db 779 CT CT GT GTCT TAT GAT AT T G GCTT AT CT C CAAAT ATT C CGT AAACT CT GGT GC C GAC AGA 838 

Qy 740 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 839 TTCCCGGAACTTCTTCTGTGGTTCAGAGAAAATGGAAGCAGC AGCAGCCGGTTT 892 

Qy 800 ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

II I I I I I II I I I I I I I II I I I I I I I I 

Db 8 93 CTCAGCCCCGGGGGTCCGGACAGCAGAGCAAGGCTCGGATTAGCGCTGTTGCTGCTGAGA 952 

Qy 860 T GAAGCAGAT GC GT GCAC GGAGGAAGACAGCCAAGAT GCT GAT G GT GGT G CT GCT GGT CT 919 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 
Db 953 T AAAGCAGAT C C GAGCAC GAAGGAAAAC AGC C CGGAT GCT CAT G GT T GTACT T CT GGT CT 1012 

Qy 920 TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 979 

I M I I I I I I II II I I I I I I I I I II I I I I I II I I I I I II II II I I I I I 
Db 1013 T T GCAAT TT G CT AT CT AC CAAT CAGC AT C C T CAAT GT G CT AAAGAGAGTAT T T GGGAT GT 1072 

Qy 980 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 

M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1073 T CACACAC AC GGAAGACAGAGAGACT GT CTAT GCTT GGTT CACT T TTT CT CAT T GGCTT G 1132 



•Qy 104 0 T GTACGC CAACAGC G CT GCCAAC C C CAT CAT CT ACAACT T C CT CAGT GGA 1089 

I II I I I I I I I I I I I I I I I I I I II II II II II II I I I I I I 
Db 1133 TAT AT GC C AAC AGT GCT GCAAAC C CAAT TAT TT AT AATT T T CT T AGTGGA 1182 



RESULT 7 
BC035858 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



BC035858 1790 bp mRNA linear HTC 04-MAR-2003 

Homo sapiens, Similar to hypocretin (orexin) receptor 2, clone 
IMAGE: 5767576, mRNA. 
BC035858 

BC035858.1 GI : 23959160 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1790) 
Strausberg, R. 
Direct Submission 

Submitted ( 31- JUL-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 

Contact: MGC help desk 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: National Institutes of Health Intramural 

Sequencing Center (NISC) , 

Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri.nih.gov 

Akhter,N. , Ayele,K. , Beckstrom-Sternberg, S.M. , Benjamin, B. , 
Blakesley, R.W. , Bouf f ard, G. G . , Breen,K., Brinkley,C, Brooks, S., 
Dietrich, N. L. , Granite, S., Guan,X., Gupta, J., Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro,Q.L. , Masiello,C. , Maskeri,B. , Mastrian, S . D. , McCloskey, J. C . , 
McDowell, J., Pearson, R. , Stantripop, S . , Thomas, P. J., Touchman, J. W. , 
Tsurgeon,C, Vogt,J.L., Walker, M. A., Wetherby, K. D . , Wiggins, L., 
Young, A., Zhang, L.-H. and Green, E.D. 



FEATURES 

source 



Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 79 Row: p Column: 14 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 6006037 
This clone has the following problem: retained intron. 

Location/ Qualifiers 

1. .1790 

/organism-"Homo sapiens" 
/mol_type= "mRNA" 
/db_xref="taxon:9606" 
/clone="IMAGE: 5767576" 



/tissue_type="Brain, fetal, whole pooled" 
/ clone_lib="NIH_MGC_12 1 " 
/lab_host="DH10B" 
/note="Vector: pCMV-SP0RT6" 

ORIGIN 

Query Match 45.9%; Score 519.8; DB 11; Length 1790; 

Best Local Similarity 70.5%; Pred. No. 4e-98; 

Matches 711; Conservative 0; Mismatches 292; Indels 6; Gaps 1; 



Qy 80 AT GAAGAT GAGTTT C T C C GCTAT CT GT GGCGT GAT TAT CT GT AC C CAAAACAGT AT GAGT 139 

I II II II II II II II I I I I I I I II II III I I I I Mi l I I I I I II 

Db 146 ACGAC GAG GAATT C CT G C GGT AC CT GT GGAGGGAAT AC CT GC AC C C GAAAGAAT AT GAGT 205 

Qy 14 0 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 206 GGGTCCTGATCGCCGGGTACATCATCGTGTTCGTCGTGGCTCTCATTGGGAACGTCCTGG 265 

Qy 200 TCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTCACCAACTACTTCATTGTCA 259 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 266 T TT GT GT GGCAGT GT GGAAGAAC CAC CACATGAGGAC GGTAAC CAACT ACT T CAT AGT CA 325 

Qy 260 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 326 ATCTTTCTCTGGCTGATGTGCTCGTGACCATCACCTGCCTTCCAGCCACACTGGTCGTGG 385 

Qy 32 0 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 

I I I I I I I I I I I I I I I I II II II I I I I I I I I I II II II I I I I I I I I I 

Db 386 AT AT C ACT GAGACCT GGT T TTTT GGACAGT CCCT T T GCAAAGT GATT C CT TAT C T ACAGA 445 

Qy 38 0 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I I I I I I II III I II II II I I I I I I I I I I I I I I I I II I I I I I I I 

Db 44 6 CCGTGTCGGTGTCTGTGTCTGTCCTCACACTGAGCTGTATCGCCTTGGATCGGTGGTATG 505 

Qy 440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 4 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 

Db 506 CAATCTGTCACCCTTTGATGTTTAAGAGCACAGCAAAGCGGGCCCGTAACAGCATTGTCA 565 

Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 566 T CAT CT G GATT GT CT C CT GC ATT AT AAT GATTCCT CAGG C CAT C GT CAT GGAGT GCAGCA 625 

Qy 560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 62 6 CCGTGTTCCCAGGCTTAGCCAATAAAACCACCCTCTTTACGGTGTGTGATGAGCGCTGGG 685 

Qy 620 CAGATGAC CT CTATCC CAAGATCTACCACAGTTGCTTCTT TATT GTCACCTACCT GGCCC 679 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 686 GT GGT GAAAT TT AT C C CAAGATGTAC C ACAT CTGTTTCTTTCTGGT GACAT AC AT G GC AC 745 

Qy 680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

I I I I I I I I I I I I I I I I I III I I I I I M I I I I I I II I I I I I II I I II 

Db 74 6 CACT GT GT CT CAT GGT GT T GGCTT AT CT GCAAAT AT T T C GCAAAC T CT GGT GT C GAC AGA 805 

Qy 740 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 806 TCCCTGGAACATCATCTGTAGTTCAGAGAAAATGGAAGCCCC TGCAGCCTGTTT 859 



Qy 800 ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

II I II I I I I I I I I I I I I I I I I I I I I I I 

Db 860 CACAG C CT C GAGG GC CAG GACAGC C AAC GAAGTC CC GGAT GAGC GCT GT GGC GGCT GAAA 919 

Qy 860 TGAAGCAGAT GC GT G C AC GGAGGAAGAC AGC CAAGAT G CT GAT GGT GGT GCT GCTGGT CT 919 

I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I I I I I I I 
Db 920 T AAAGCAGAT CCGAGC C AGAAGGAAAAC AGC C CGGAT GT T GAT GGTT GT GC T TT T GGTAT 979 

Qy 920 TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 97 9 

I II I I I I I I II II II III I I I I I I I I I I II I I I I I II II I II I I I I 
Db 980 TT GCAAT T T GCTAT C T AC CAATTAGCAT CCT CAAT GTG CTAAAGAGAGT AT T T GGGAT GT 1039 

Qy 980 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1040 TT GC C CAT ACT GAAGACAGAGAGACT GT GT AT G CCT GGT T T AC CT TT T CAC ACT GGCTT G 1099 

Qy 1040 T GT AC GC CAACAGC G CT GC CAAC C C CAT CAT CTACAACT T CCT CAGT GG 108 8 

I II I I I I I II I I I I I II II II II I I II II I I I II I I I 
Db 1100 TAT AT GC CAATAGT G CT GC GAAT C CAAT TAT T T ATAAT T T T CT CAGTG G 114 8 



RESULT 8 
AK079572 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



AK079572 3153 bp mRNA linear HTC 19-SEP-2003 

Mus mus cuius adult male hypothalamus cDNA, RIKEN full-length 
enriched library, clone :A230091E19 product : OREXIN RECEPTOR TYPE 2, 
full insert sequence. 
AK079572 

AK079572.1 GI: 26348079 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K 
Konno, H. , 
Sumi,N 



, Itoh,M., 
Akiyama, J. 



Aizawa, K. 
, Nishi,K. 



Ishii, Y. , Nakamura, S. 



Carninci, P . , 
, Itoh,M. , 
Harada,A. , 



Nagaoka,S., Sasaki, N., 
Kitsunai,T. , Tashiro,H 
Hazama,M. , Nishine,T. , 
Yamamoto,R., Mat sumo to, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K . , 
Fujiwake,S. , Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu, M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 



TITLE RIKEN integrated sequence analysis (RISA) system— 384-format 

sequencing pipeline with 384 multicapillary sequencer 
JOURNAL Genome Res. 10 (11), 1757-1771 (2000) 
MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 

FANTOM Consortium. 
TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 3153) 

AUTHORS Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P. 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida,K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A. , Toya,T., Yasunishi , A. , 
Muramatsu,M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted ( 16-APR-2002 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama 
Kanagawa 230-0045, Japan (E-mail: genome- res @gs c . riken. go. jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL:http: / / genome . gsc. riken. go . jp/ 
URL: http : / /f antom. gsc. riken. go . jp/ . 
FEATURES Location/Qualifiers 
source 1. .3153 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref="FANTOM_DB:A230091E19" 

/ db_x r e f = "MGI : 2 4 0 3 5 1 7 " 

/db_xref="taxon: 10090" 

/clone= ,, A230091E19" 

/ sex="male" 

/tissue_type="hypothalamus" 

/clone_lib="RIKEN full-length enriched mouse cDNA library 



/ de v_s t age= " adul t " 
CDS .. 108.- .1202 

/note="unnamed protein product; OREXIN RECEPTOR TYPE 2 
(SWISSPROT|P56719, evidence: FASTY, 98.5%ID, 100%length, 
match=1380) 
putative" 
/ codon_start=l 
/protein_id= M BAC37688 . 1" 
/db_xref="GI: 26348080" 

/ trans lation= "MS STKLEDSLSRRNWSSASELNETQEPFLNPTDYDDEEFLRYLW 
RE YLH P KE YEWVL I AG Y 1 1 VFWALI GNVLVCVAWKNHHMRT VTN Y FI VNL S LADVL 
VT I TCLPAT LWDI TETWFFGQS LCKVI P YLQTVSVS VS VLTLS C I ALDRWYAI CHPL 
MFKSTAKRARNSIWIWIVSCIIMIPQAIVMECSSMLPGLANKTTLFTVCDEHWGGEV 
Y P KMYH I C FFLVT YMAP L FLMI LAYLQ I FRKLWCRQ I PGT S S WQRKWKQQQ PVS Q P R 
GSGQQ S KARVS AVAAEI KQ I RARRKT ARMLMWL L VFAI CYLP I S I LNVLKRVFGMFT 
HTEDRETVYAWFTFPHWLVYANSCCKPNYL" 

ORIGIN 

Query Match 45.8%; Score 519.4; DB 11; Length 3153; 

Best Local Similarity 71.0%; Pred. No. 6.3e-98; 

Matches 718; Conservative 0; Mismatches 286; Indels 7; Gaps 2; 

Qy 8 0 AT GAAGAT GAGTT T CT CC GCT AT CT GT GGCGT GAT TAT CT GT AC C CAAAACAGT AT GAGT 139 

I M M II II II II II I I I I I I I II I I II I I I I III I I I I I I I I 
Db 211 AC GAC GAGGAAT T CCT GCG GT ACCT GT GGAGGGAAT AC CTACAC C C GAAAGAATATGAGT 270 

Qy 140 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 271 GGGTCCTGATCGCAGGGTATATCATCGTGTTCGTTGTGGCTCTCATCGGGAACGTCCTGG 330 

Qy 2 00 TCT GCCTGGCCGT GTGGCGGAACCACCACATGAGGACAGTCACCAACTACTT CATTGT CA 259 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I Mil 
Db 331 TCT GT GT GGCAGT GT GGAAGAAC CACC AC ATGAGGACAGT C AC CAACT ACT T C AT AGT C A 390 

Qy 2 60 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I Till 

Db 391 ACCTTTCCCTAGCAGATGTGCTTGTGACCATCACCTGCCTTCCAGCTACCCTCGTTGTTG 450 

Qy 32 0 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 

I I I I I I II I I I I III I II II II I I I I I I I I I I I I I I I II III I I I I I 
Db 451 AC AT C ACT GAGACT T GGTTCTTTG GAC AGT C C CT CT GT AAGGT CAT T C C T TAT T T AC AGA 510 

Qy 38 0 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I M I I I I I I III I II II II I I I I I IN Ml I I I I I I I I I I I I I 
Db 511 CTGTGTCAGTGTCTGTGTCTGTTCTTACGTTGAGCTGCATTGCCTTGGACCGATGGTACG 570 

Qy 440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 571 CC AT T T GT CAC C CT TTGAT GT T CAAGAGC ACAGC CAAACGGGCT C GAAAC AG C AT CGT T G 630 

Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 631 TCAT CT GGAT CGT CT CCT GCAT CATAAT GATT CCT CAAGCCATT GT CAT GGAGT GCAGCA 690 

Qy 5 60 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 

Db 691 GCAT GCT CCCT GGC CTAGC CAATAAGAC C AC CCT CT T T AC AGT AT GT GAT GAAC ACT GGG 750 



Qy 

Db 



620 
751 



CAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCC 67 9 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I 
GCGGT GAAGT T T AC C C AAAGAT GT AC CAT AT CT GCT T CTTTCT GGT GACAT AC AT GGC AC 810 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

I Ml II III I I I I III I I I I I I I I I I I I II I I I I I I I I I I I M I 

811 CTCTGTTTCTTATGATATTGGCTTATCTCCAAATATTCCGTAAACTCTGGTGCCGACAGA 870 

74 0 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

I Mill II I II I I I I I I I I I I I I I I I I I I I I I 

871 TTCCCGGAACTTCTTCTGTGGTTCAGAGAAAATGGAAGCAGC AGCAGCCGGTTT 924 



800 



925 



860 



985 



920 



ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

II I I I I I II I II I INI I I I I I I I II I 

CTCAGCCCCGGGGGTCCGGACAGCAGAGCAAGGCTCGGGTTAGCGCTGTTGCTGCTGAGA 984 

TGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCT 919 
I I I I I I I I I I I I I I I I, I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
TAAAGCAGAT C CGAGCACGAAGGAAAACAGCCCGGAT GCT CATGGTTGTACTT CT GGT CT 104 4 



TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 97 9 

I M I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I II II I I I I I II 
1045 T T GCAATT T GCT AT CT AC CAAT CAGC AT C CT CAAT GT G CTAAAGAGAGT ATTT GGGAT GT 1104 

980 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1105 T CACACAC AC GGAAGAC AGAGAGACT GT CT AT GCT T G GT T CACTT T T C CT CAT T GGCTTG 1164 

1040 T GT AC G C C AAC AG C - G C T G C C AAC C C CAT CAT C T AC AAC T T C C T C AGT G G A 1089 

I M I I I I I I I I I I I I I I I I I I I II II II I I II II I I I I I I 
1165 TAT AT GCCAACAG CT G CT G CAAAC CCAAT T ATTT AT AAT T TT CTT AGT GGA 1215 



RESULT 9 

CF147830/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo.. 



CF147830 790 bp mRNA linear EST 25-JUL-2003 

AGENCOURT_14740202 NIH_MGC_145 Homo sapiens cDNA clone 
IMAGE: 6971889 5', mRNA sequence. 
CF147830 

CF147830. 1 GI: 33244098 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 790) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Daniela S. Gerhard, Ph.D. 
Office of Cancer Genomics 
National Cancer Institute / NIH 
Bldg. 31 RmlOA07 Bethesda, MD 20892 
Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: GPCR Consortium 
cDNA Library Preparation: GPCR Consortium 



cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/ LLNL at: 
http : // image . llnl . gov 
Plate: IRBI02 row: a column: 08 
High quality sequence start: 7 
High quality sequence stop: 738. 
FEATURES Location/Qualifiers 
source 1. .790 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone=" IMAGE: 6971889" 
/ tissue_type="mixed" 
/lab_host="DHlOB" 
/clone JLib="NIH_MGC_145" 

/note="Vector : pcDNA3.1; Site_l: varies by clone; Site_2 : 
varies by clone; ORFs were PCR- amplified and cloned into 
pcDNA3.1 by the GPCR Consortium. Cloning sites vary by 
clone and include the following: 5 1 -EcoRV-Xmnl/XhoI-3 1 , 
5 ' -EcoRV-Xmnl/NotI-3 1 , EcoRV (TA cloned, non-directional). 
For information about which gene each clones represents, 
please visit our anonymous ftp site at 

ftp : //image . llnl . gov/image/rearrayed_plates/lRBI . preSV. dat 
a Note: this is a NIH_MGC Library." 

ORIGIN 

Query Match 44.5%; Score 504.4; DB 14; Length 790; 

Best Local Similarity 99.8%; Pred. No. 4.7e-95; 

Matches 505; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 583 C GCACAC GGCT CT T CT C AGT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT CCCAAGAT C 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 90 CGCACACGGCTCTT CT CAGTCTGTGAT GAACGCT GGGCAGAT GACCT CT ATCCCAAGATC 731 

Qy 643 TACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCC 7 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 730 TACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCC 671 

Qy 7 03 TATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTG 7 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I 
Db 670 TAT T T CCAGAT AT T C C GCAAGCT CTGG GGC C GC C AGAT CC C C GGCAC C ACCT CAGCACT G 611 

Qy 7 63 GTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGA 822 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I Hi I I I I I I I II I I I I I I I I I I I I I I I 

Db 610 GTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGA 551 

Qy 823 GAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGG 882 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 GAGCCCCAGCCCCGGGCCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGG 491 

Qy 883 AAGACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATC 942 

I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 90 AAGACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATC 4 31 



Qy 



943 AGC GT CCT CAAT GT C C T T AAGAGGGT GT T C GGGAT GTT CC GC CAAGC C AGT GACC G CGAA 



1002 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 430 AGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAA 371 

Qy 1003 GCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAAC 1062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 37 0 GCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAAC 311 

Qy 1063 C C CAT CATCT ACAACT T C CT CAGT GG 1088 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 310 C C CAT CAT CT ACAACT T C CT C AGT GG 285 



RESULT 10 

AY420886 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Pan. 



AY420886 750 bp DNA linear GSS 17-DEC-2003 

Pan troglodytes HCRTR1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY420886 

AY420886. 1 GI : 39776843 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 750) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 
Clark, A. G. , 



to 750) 
Glanowski, S . 



ORIGIN 



Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 2 0850, USA 

This sequence as made by sequencing genomic exons and ordering them 
based on alignment. 

Location/Qualifiers 

1. .750 

/organism="Pan troglodytes" . • 

/mol_type= 11 genomic DNA" 

/db_xref =" taxon : 9598 " 

<1. .>750 . 

/gene="HCRTRl" 

/locus__tag="HCM7373" 



Query Match 41.9%; Score 474.2; DB 29; Length 750; 

Best Local Similarity 84.5%; Pred. No. 9.7e-89; 

Matches 476; Conservative 0; Mismatches 87; Indels 0; Gaps 



0; 



Qy 

Db 



526 ATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGC 585 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- 1 I I I I I I I I I I I I I I I I I I I I I I 
1 ATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGC 60 



Qy 586 ACACGGCTCTTCTCAGTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTAC 64 5 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACAC GG CT CTT CT CAGT CT GT GAT GAAC GCT GG GC AGAT GACCT CT AT C C CAAGAT CT AC 120 

Qy 646 CACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTAT 7 05 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTAT 180 



Qy 7 06 T T C CAGAT ATT C C GCAAGCT CT GGG G C C GC CAGAT C C C C GGCAC CAC C T CAGCACTGGT G 765 

I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 TTCCAGATATTCCGC7KAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTG 24 0 

Qy 766 C GGAACT GGAAG C GC C C CT CAGACC AG CT G GGGGAC CT GGAGCAGGGC CT GAGT GGAGAG 825 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M 
Db 241 C G GAACT GGAAG C G C C C CTCAGACCAGCT GGGGGAC CT GGAGCAGGG C CT GAGTGGAGAG 300 

Qy 826 CCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAG 885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCCCAGCCCCGGGCCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCGCGGAGGAAG 360 

Qy 886 ACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGC 945 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGT 420 

Qy 94 6 GT C CT CAAT GT C CT TAAGAGGGTGT T C GG GAT GTTC C GC CAAGCCAGT GAC C GC GAAGCT 1005 

I I I I I I I I I I I I I I I I I I I I 

Db 421 GTCCTCAATGTCCTTAAGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 480 

Qy 1006 GTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCC 1065 

II I I I I I I I I I I I I I I I I I 

Db 4 81 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACGCCAACAGNNNNGCCAACCCC 54 0 



Qy 1066 AT CAT CT ACAACTT C CT C AGT GG 1088 

I I I I I I I I II I I I I I I I I I I 
Db 541 AT CANNN ACAACTT CCT CAGT GG 563 



RESULT 11 

AL535838 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



AL535838 1001 bp mRNA linear EST 12-MAY-2003 

AL535838 Homo sapiens FETAL BRAIN Homo sapiens cDNA clone 
CS0DF013YE04 5-PRIME, mRNA sequence. 
AL535838 

AL535838.2 GI: 30542758 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 1001) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



COMMENT On Feb 13, 2001 this sequence version replaced gi: 12799331. 

Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r , ' Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies , a division of 
Invitrogen. This sequence belongs to sequence cluster 151. r For 
more information about this cluster, see 
http: / /www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DF013BC02QPl&cluster=151. r . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DF013BC02QP1 . 
FEATURES Location/Qualifiers 
source 1. .1001 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="CS0DF013YE04" 

/tissue_type="FETAL BRAIN" 

/dev_stage=" fetal" \ 

/clone_lib="Homo sapiens FETAL BRAIN" 

/note="Organ: brain; Vector: pCMVSP0RT_6; 1st strand cDNA 
was primed with a Notl-oligo (dT) primer. Five prime end 
enriched, double-strand cDNA was digested with Not I and 
cloned into the Not I and EcoRV sites of the pCMVSPORT 6 
vector. Library was not normalized." 

ORIGIN 

. Query Match 41.7%; Score 472; DB 9; Length 1001; 

Best Local Similarity 92.0%; Pred. No. 3.2e-88; 



Matches 


544; Conservative 13; Mismatches 25; Indels 9; Gaps 


6 


Qy 


377 


AGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGT 


436 






1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


415 


AGGCTGTGTCCGTGTCANTGGCAGTGCTAACTCTMANCTTCATCGCMCTGGACCGCTGGT 


474 


Qy 


437 


ATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCC 


496 






1 1 1 1 : 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


475 


ATGCHATCTGCYACCCACTATTGTTCAAGARCACAGCCCGGCGGGCCCGTGGCTCCATCC 


534 


Qy 


497 


TGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCA 


556 






1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


535 


TNNGNATCTGGGCTNTNTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCA 


594 


Qy 


5o7 


GCAGT GT G CT GC CT GAGCT AGC CAAC C GCACAC GGCT CTT CT CAGT CT G'i GAT GAAC GCT 


616 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


595 


GCAGTGTGCTGCCTNAGCTANCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCT 


654 


Qy 


617 


GGGCAGATGACCTCTATCCC7WVGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGG 


676 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


655 


GGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGG 


714 


Qy 


677 


CCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCC 


736 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


715 


CCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCC 


774 



Qy 


737 


Db 


775 


Qy 


796 


Db 


835 


Qy 


856 


Db 


893 


Qy 


916 


Db 


950 



AGAT C C C C GGCAC CACCT C AGCACT GGT G CG GAACT GGAAGC GCC C CT CAGAC C AGCT - G 7 95 

M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGG 834 

GGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCT 855 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

GGGGAC CT GGAG C AG GGC CT GAGT GGAGAGCC C — AGCCCCGGGCCGCGCCTTCCTGGCT 892 



I I I I I II 



I I 



II I : I I I I I : I : I I I I I I I I I I I I I I I I : I I I I I I 



GTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGG 966 
: I I I I I i I I I I I I I I I I : I I I I I I II I : I I I I I I I II I I I MINI 
STCTTCG-CCTCTGCTACSTG-CCATCAGSGT-CTCAATGTCTTAAAGAGG 997 



RESULT 12 

AY420887 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Craniata ; Vertebrata ; Euteleos tomi ; 
Sciurognathi; Muridae; Murinae; Mus. 



AY420887 726 bp DNA linear GSS 17-DEC-2003 

Mus musculus HCRTR1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY420887 

AY420887. 1 GI : 39776844 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 

1 (bases 1 to 726) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Ferriera, S 



to 726) 

Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
, Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 208-51), USA 

This sequence as made by sequencing genomic exons and ordering them 
based on alignment. 

Location/Qualifiers 

1. .726 

/organism= M Mus musculus" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>726 
/gene="HCRTRl" 
/locus_tag="HCM7 373" 



ORIGIN 



Query Match 41.4%; Score 468.6; DB 29; Length 726; 

Best Local Similarity 89.5%; PrecL No. 1.4e-87; 

Matches 504; Conservative 0; Mismatches 59; Indels 0; Gaps 



0; 



Qy 526 ATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGC 585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III 

Db 1 ATGGTGCCCCAGGCTGCTGTCATGGAGTGCAGCAGCGTGCTGCCTGAGCTAGCCAATCGC 60 

Qy 58 6 ACAC GGCT CT TCT CAGT CT GT GAT GAAC GCT GGGCAGATGAC CT CTAT C CCAAGAT CT AC 645 

II II I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 ACCCGGCTCTT CTCTGT CTGT GATGAGCACT GGGCAGAT GAACT CTACCCCAAGATCTAT 120 

Qy 64 6 CACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTAT 705 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | || | | | | | | | | | 
Db 121 CACAGCTGCTTTTTCATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCTATGGCCTAT 180 

Qy 706 TTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTG 765 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
Db 181 T T C CAGAT CT T CCGCAAGCT CT GGG G C C GCC AGAT C C CT GGT AC CACAT CAGCCTT GGT G 240 

Qy 766 CGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAG 825 

I I I I I I I I I I I II I I I I I II II I I I I II I I I I I I I I I I I II I I II 
Db 241 CGGAACTGGAAACGGCCCTCGGAACAACTGGAGGCTCAGCACCAGGGCCTCTGTACAGAG 300 

Qy 82 6 CCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAG 885 

I I I I I I I II I I I I III I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I II I I I 
Db 301 CCCCAGCCCCGGGCCCGAGCCTTCCTGGCTGAGGTGAAGCAGATGCGAGCTCGGAGGAAG 360 

Qy 886 ACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGC 945 

M II I I I I I I I I I I I I I I II I I I I I I I I II II I I I I I II I I I I I I I I I I I 
Db 361 ACGGCTAAGATGCTGATGGTAGTCCTGCTGGTTTTTGCACTCTGTTATCTGCCCATCAGT 420 

Qy 94 6 GTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCT 1005 

I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 421 GT C CT CAAT GT C CTTAAGAGAGT GTT C GGGAT GT T CC GC CAAG C C AGC GACC GGGAAGC C 480 

Qy 1006 GTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCC 1065 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 481 GTCTACGCCTGCTTCACCTTCTCCCACTGGCTAGTGTACGCCAACAGTGCCGCCAACCCT 54 0 

Qy 1066 AT CAT CT ACAACTT CCT CAGT G G 108 8 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CAT CTACAACTT CCT CAGT G G 563 



RESULT 13 
BM926746 

LOCUS BM926746 993 bp mRNA linear EST 12-MAR-2002 

DEFINITION AGENCOURT_6681991 NIH_MGC_121 Homo sapiens cDNA clone IMAGE : 5767576 

5', mRNA sequence. 
ACCESSION BM926746 

VERSION BM926746.1 GI: 19377125 

KEYWORDS EST . 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 993) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 
cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : //image . llnl . gov 

Plate: LLAM12826 row: a column: 17 
High quality sequence stop: 684. 

Location/ Qualifiers 

1. .993 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/clone="IMAGE: 5767576" 

/lab_host="DH10B" 

/clone_lib="NIH_MGC_121" 

/note="Organ: brain; Vector: pCMV-SP0RT6; Site_l: NotI; 
Site_2: EcoRV (destroyed); RNA source anonymous pool of 3 
fetal brains, female age 20 weeks, female age 24 weeks, 
and male age 26 weeks. Library is oligo-dT primed and 
directionally cloned (EcoRV site is destroyed upon 
cloning) . Average insert size 1.7 kb, insert size range 
0.7-3.5 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 017. Note: 
this is a NIH_MGC Library." 



ORIGIN 



Query Match 34.7%; Score 393.2; DB 12; Length 993; 

Best Local Similarity -72.1%; Pred. No. le-71; 

Matches 512; Conservative 0; Mismatches 198; Indels 0; Gaps 0; 



Qy 



Db 



80 AT GAAGAT GAGTT T CT CCGCT AT C T GT GGC GT GAT TAT CT GT AC C CAAAACAGT AT GAGT 139 
I M II II II II II II I I I I I I I II II III I I I I III I I I I I I I I 
145 ACGACGAGGAATTCCT GCGGTACCT GT GGAGGGAAT ACCTGCACC CGAAAGAATATGAGT 204 



Qy 



Db 



140 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I'll I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I ' i I I I 

205 GGGTCCTGATCGCCGGGTACATCATCGTGTTCGTCGTGGCTCTCATTGGGAACGTCCTGG 264 



Qy 

Db 

Qy • 

Db 



200 TCTGCCTGGCCGTGT G GC GGAAC C AC CACAT GAG GAC AGT CAC C AACT ACT T CAT T GT C A 259 

I N I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

265 TTTGTGT GGCAGT GTGGAAGAAC CAC CACAT GAGGACGGTAACCAACTACTT CATAGT CA 324 

260 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I M M I I I I I I I I M M I I I I I I I I M I I II I I I I III I II I I 

325 ATCTTTCTCTGGCTGATGTGCTCGTGACCATCACCTGCCTTCCAGCCACACTGGTCGTGG 384 



Qy 



320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



385 



I I I I I I I I I I I I I I I I II II II I I II I I I I I II II II I I I I I I I I I 

AT AT C ACT G AGAC CT GGT TT T TT GGAC AGT C CCT T T GCAAAGT GAT T C CTT AT CT AC AGA 



380 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 
I I I I I I I I I I I III I II II II II I I I I I I I I I I I I I I II I I I I I I I 
445 CCGTGTCGGTGTCTGTGTCTGTCCTCACACTGAGCTGTATCGCCTTGGATCGGTGGTATG 



440 



505 



500 



565 



560 



625 



620 



685 



CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 
I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I II I I I III I 
CAATCTGTCACCCTTTGATGTTTAAGAGCACAGCAAAGCGGGCCCGTAACAGCATTGTCA 

GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T C AT CT GGAT T GT CT C CT G CATT ATAAT GAT T CCT C AGGCCAT C GT CAT GGAGT GC AGCA 

GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 
I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I 

CCGTGTTCCCAGGCTTAGCCAATAAAACCACCCTCTTTACGGTGTGTGATGAGCGCTGGG 



444 



439 



504 



499 



564 



559 



624 



619 



684 



C AGAT GAC CT CT AT C C CAAGAT CTAC CACAGT TGCTTCTT T ATT GT C AC CTAC CT GGC CC 679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GT GGT GAAAT TT ATC C CAAGAT GT AC C ACAT CT GT T T CTT T CT GGT GACATACAT GGCAC 744 



68 0 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

I I I I I I I I I I I I I I I I I III I II I I I I I I I I I I I I I I I I I II I I I I 
745 CACTGTGTCTCATGGTGTTGGCTTATCTGCAAATATTTCGCAAACTCTGGTGTCGACAGA 804 

74 0 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGAC 789 

I I I I I I I I I I I I I I I I I I I I I I I III II I 
805 T C C CT GGAAC AT CAT CT GT AGT TCAGAGAAAAT G GAAAGC CCCT GGAGCC 854 



RESULT 14 

BX119589 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
COMMENT 



BX119589 543 bp mRNA linear EST 10-FEB-2003 

BX119589 Soares infant brain 1NIB Homo sapiens cDNA clone 
IMAGp998P20171 ; IMAGE: 40608, mRNA sequence. 
BX119589 

BX119589. 1 GI: 28289997 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 543) 
Ebert,L., Heil,0., Hennig,S. f 
Radelof,U., Schneider, D. and Korn,B. 
Human UnigeneSet - RZPD3 
Unpublished (2003) 
Contact: Ina Rolfs 

RZPD Deutsches Ressourcenzentrum fuer Genomf orschung GmbH 
Im Neuenheimer Feld 580, D-69120 Heidelberg, Germany 
RZPD; IMAGp998P20171. 

RZPDLIB; I.M.A.G.E. cDNA Clone Collection; 
Human UnigeneSet - RZPD3 (RZPDLIB No. 972) 
http : / /www. rzpd.de/CloneCards/cgi- 

bin/showLib.pl . cgi/response?libNo=972 Contact: Ina Rolfs 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Homo. 

Neubert,P., Partsch,E., Peters, M. , 



FEATURES 

source 



RZPD Deutsches Ressourcenzentrum fuer Genomf orschung GmbH 
Heubnerweg 6, D-14059 Berlin, Germany 
Tel: +49 30 32639 101 
Fax: +49 30 32639 111 
www. rzpd.de 

This clone is available royalty-free from RZPD; 

contact RZPD (clone@rzpd.de) for further information. Seq primer: 
M13u, Primer sequence: CGTTGTAAAACGACGGCCAGT . 

Location/Qualifiers 

1. .543 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 

/clone="IMAGp998P20171 ; IMAGE : 4 0608 " 
/sex="female" 

/dev_stage="73 days post natal" 
/lab_host="DH10B (ampicillin resistant)" 
/clone__lib="Soares infant brain 1NIB" 

/note="Organ: whole brain; Vector: Lafmid BA; Site_l: Not 
I; Site_2: Hind III; 1st strand cDNA was primed with a Not 
I - oligo(dT) primer [5 1 

AACTGGAAGAATTCGCGGCCGCAGGAATTTTTTTTTTTTTTTTTT 3 1 ] ; 
double-stranded cDNA was ligated to Hind III adaptors 
(Pharmacia), digested with Not I and directionally cloned 
into the Not I and Hind III sites of the Lafmid BA vector. 
Library went through one round of normalization. Library 
constructed by Bento Soares and M.Fatima Bonaldo." 



ORIGIN 



Query Match 33.1%; 
Best Local Similarity 98.7%; 
Matches 377; Conservative 



Score 374.6; DB 13; Length 543; 
Pred. No. 6e-68; 
0; Mismatches 5; Indels 0; 



Gaps 



0; 



Qy 



Db 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
158 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 217 



Qy 

Db 

Qy 
Db 



61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
218 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGCGATTATCTG 277 

121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
278 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 337 



Qy 

Db 

Qy 

Db 



181 



338 



241 



CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACAx GAGGACAGTC 
I I I I I I I I I I I I I I I I 1 I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 



ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
398 ACC7VACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 



240 



397 



300 



457 



Qy 

Db 



301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | Ml 
458 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGNAAG 



360 
517 



Qy 361 GTCATCCCCTATCTACAGGCTG 382 

I I I I I I I I I I I I I I I I I I I I 
Db 518 GTCATCCCCTATCTACAGACAG 539 



RESULT 15 

CF147829 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



ORIGIN 



CF147829 788 bp mRNA linear EST 25-JUL-2003 

AGENCOURT_14740210 NIH_MGC_145 Homo sapiens cDNA clone 
IMAGE: 6971890 5', mRNA sequence. 
CF147829 

CF147829.1 GI: 33244097 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 788) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Daniela S. Gerhard, Ph.D. 
Office of Cancer Genomics 
National Cancer Institute / NIH 
Bldg. 31 RmlOA07 Bethesda, MD 20892 
Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: GPCR Consortium 
cDNA Library Preparation: GPCR Consortium 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Agencourt Bioscience Corporation 

Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : / / image . llnl . gov 

Plate: IRBI02 row: a column: 09 

High quality sequence start: 9 

High quality sequence stop: 772. 
Location/Qualif iers 
1. .788 

/organism="Homo sapiens" 

/mol_type="rnRNA" 

/db_xref="taxon: 9606" 

/clone="IMAGE: 6971890" 

/tissue_type-"mixed" 

/lab_host="DH10B" 

/clone_lib="NIH_MGC_145" 

/note^Vector : pcDNA3.1; Si-te_l: varies by clone; Site__2 :'- (k ' 
varies by clone; ORFs were PCR- amplified and cloned into 
pcDNA3.1 by the GPCR Consortium. Cloning sites vary by 
clone and include the following: 5 1 -EcoRV-XmnI/XhoI-3 1 , 
5 ' -EcoRV-Xmnl/NotI-3 1 , EcoRV (TA cloned, non-directional). 
For information about which gene each clones represents, 
please visit our anonymous ftp site at 

ftp: / /image. llnl . gov/ image/ rearrayed_plates/lRBI . preSV. dat 
a Note: this is a NIH_MGC Library." 



Query Match 



32.4%; Score 367; DB 14; Length 788; 



Best Local Similarity 72.7%; Pred. No. 2.8e-66; 

Matches 472; Conservative 0; Mismatches 177; Indels 0; Gaps 0; 



Qy 80 AT GAAGAT GAGT T T CT C C GCT AT CT GT GGCGT GAT TAT CTGT AC C CAAAACAGT AT GAGT 139 

I II II II M II M M I I I I I I I II II III I I I I II I I I I I I I I I 
Db 140 AC GACGAGGAATTCCT GCGGTACCT GT GGAGGGAATACCTGCACCCGAAAGAATAT GAGT 199 

Qy 140 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 200 GGGTCCTGATCGCCGGGTACATCATCGTGTTCGTCGTGGCTCTCATTGGGAACGTCCTGG 259 

Qy 200 TCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTCACCAACTACTTCATTGTCA 259 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I 
Db 260 T TT GT GT GGC AGT GT G GAAGAACCAC CACAT GAGGAC GGT AAC CAACT ACT T CATAGT C A 319 

Qy 260 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 320 ATCTTTCTCTGGCTGATGTGCTCGTGACCATCACCTGCCTTCCAGCCACACTGGTCGTGG 379 

Qy 320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 

I I I I I I III I I I I I I II II II I I II I I I I I II II II I I I I I I I I I 
Db 380 AT AT C AC C GAGAC CT GGT T T T TT GGAC AGT CCCT T T GCAAAGT GATT CCT T AT CT AC AGA 439 

Qy 380 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I I I I I I I I III I II II II II I I I I I I I I I I I I I I II I I I I I I I 
Db 440 CCGTGTCGGTGTCTGTGTCTGTCCTCACACTGAGCTGTATCGCCTTGGATCGGTGGTATG 499 

Qy 440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 500 CAAT CT GT CAC CCT TT GAT GT T T AAGAG CACAG CAAAGC GGGC C C GT AAC AG CATTGT CA 559 

Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I I I I I I I I I I I I II 111 I II Mill I I I II I I I I I I I I I I 

Db 560 T CAT CTGGATTGT CTCCT GCATTATAATGATTCCT CAGGCCAT CGT CATGGAGTGCAGCA 619 

Qy ' 560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I I I I I I I I I I I I I I * I I I I I I I I I I I I I I I I I I I I I I I 

Db 620 CTGTGTTCCCAGGCTTAGCCAATAAAACCACCCTCTTTACGGTGTGTGATGAGCGCTGGG 679 

Qy 620 CAGAT GAC CT CTAT CC C AAGAT CTAC C ACAGTT G CT T CTTT ATT GT CAC CT AC CT GGC CC 679 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 680 GT GGT GAAAT T T AT CC CAAGAT GT AC CACAT CTGTTTCTTTCTGGT GACATACAT GG CAC 739 

Qy 680 CACT GGGCCT C AT GGCCAT GG CCT AT T T C CAGAT AT T C CGCAAG CT CT G 72 8 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 740 CACTGTGTCTCATGGTGTTGGCTTATCTGNCAATATTTCGCANACTCTG 788 



Search completed: October 15, 2004, 22:50:33 
Job time : 3299.03 sees 



GenCore version 5,1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



October 15, 2004, 13:54:41 ; Search time 4590.56 Seconds 

(without alignments) 
10697.520 Million cell updates/sec 



Title: 



Sequence : 



US-10-070-532-5 



Perfect score: 1133 



1 atggagccctcagccacccc tcctgaccatcgtgccccgg 1133 



Scoring table: IDENTITY_NUC 

Gapop 10.0.., Gapext 1.0 



Searched: 



3470272 seqs, 21671516995 residues 



Total number of hits satisfying chosen parameters: 



6940544 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database 



GenEmbl : * 

1 : gb_ba : * 

2: gbjitg:* 

3: gb_in:* 

4 : gb_om : * 

5 : gb_o v : * 
6: gb_pat:* 
7 : gb_ph : * 

8 : gb_pl : * 

9 : gb_p r : * 

10: gb_ro:* 

11: gb_sts:* 

12: gb_sy:* 

13: gb_un:* 

14: gb_vi:* 

15: em_ba:* 

16: em_fun:* 

17: em_hum: * 

18: em_in:* 

1 9 : em_mu : * 

20: em_om:* 

21: em_or:* 

22: em_ov:* 

23: em_pat:* 

2 4 : emjph : * 

25: em_pl : * 

26: em_ro:* 

27: em sts:* 



28 


: em un : * 


29 


: em vi : * 


30 


: em htg hum: * 


31 


: em htg__inv: * 


32 


: emJitg_other : * 


33 


: em htg mus : * 


34 


: em htg pin: * 


35 


: em htg rod: * 


36 


em htg mam: * 


37 


em htg vrt : * 


38 


em sy:* 


39 


em htgo hum: * 


40 


. em_htgo_mus : * 


41 


ernjitgo other: 



Precl. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 



Jo. 


Score 


Match 


Length 


DB 


ID 


Description 


1 


1131. 


4 


99 . 


9 


1133 


6 


E43973 


E43973 Novel G pro 


2 


1131. 


4 


99. 


9 


1133 


6 


AX746120 


AX746120 Sequence 


3 


1131. 


4 


99. 


9 


1133 


6 


BD185454 


BD185454 Human neu 


4 


1128. 


2 


99. 


6 


1170 


6 


E43972 


E43972 Novel G pro 


5 


1128. 


2 


99. 


6 


1170 


6 


AX746118 


AX746118 Sequence 


6 


1114. 


4 


98. 


4 


1116 


6 


AR216119 


AR216119 Sequence 


7 


1086. 


4 


95. 


9 


1209 


6 


AR216117 


AR216117 Sequence 


8 


1086. 


4 


95. 


9 


1564 


6 


E43974 


E43974 Novel G pro 


9 


1086. 


4 


95. 


9 


1564 


6 


E50810 


E50810 Novel G pro 


10 


1086. 


4 


95. 


9 


1564 


6 


E50811 • 


E5081L Novel G pro 


11 


1086. 


4 


95. 


9 


1564 


6 


AX299473 


AX299473 Sequence 


12 


1086.4 


95. 


9 


1564 


6 


AX299475 


AX299475 Sequence 


13 


1086. 


4 


95. 


9 


1564 


6 


AX549082 


AX549082 Sequence 


14 


1086. 


4 


95. 


9 


1564 


6 


AX746121 


AX746121 Sequence 


15 


1086. 


4 


95. 


9 


1564 


6 


AX840912 


AX840912 Sequence 


16 


1086. 


4 


95. 


9 


1564 


9 


AF041243 


AF041243 Homo sapi 


17 


1084. 


8 


95. 


7 


1110 


6 


AR216118 


AR216118 Sequence 


18 


1081. 


6 


95. 


5 


1209 


6 


BD185452 


BD185452 Human neu 


19 


1081. 


6 


95. 


5 


1278 


6 


AX280925 


AX280925 Sequence 


20 


1076. 


8 


95. 


0 


1110 


6 


BD185453 


BD185453 Human neu 


21 


892. 


8 


78. 


8 


2200 


10 


AY336083 


AY336083 Mus muscu 


22 


891. 


2 


78. 


7 


2469 


10 


AF041244 


AF041244 Rattus no 


23 


697. 


6 


61. 


6 


843 


6 


AR109899 


AR109899 Sequence 


24 


670. 


6 


59. 


2 


789 


6 


AR109632 


AR109632 Sequence 


25 


670. 


6 


59. 


2 


789 


6 


E12154 


E12154 cDNA encodi 


26 


670. 


6 


59. 


2 


789 


6 


AR300942 


AR300942 Sequence 


27 


579. 


6 


51. 


2 


781 


10 


AF394596 


AF394596 Mus muscu 


28 


554. 


4 


48. 


9 


3114 


10 


AF041246 


AF041246 Rattus no 


29 


530. 


4 


46. 


8 


1545 


10 


AY336084 


AY336084 Mus muscu 


30 


530. 


4 


46. 


8 


2117 


10 


AY336085 


AY336085 Mus muscu 


31 


. 520. 


8 


46. 


0 


1633 


6 


E33974 


E33974 cDNA clone 


32 


520. 


8 


46. 


0 


1843 


6 


AX549084 


AX549084 Sequence 


33 


520. 


8 


46. 


0 


1843 


6 


AX840914 


AX840914 Sequence 



34 


520 


.8 


46. 


0 


1878 


9 


AF041245 


AF041245 Homo sapi 


35 


516 


45. 


5 . 


1335 


6 


AX280927 


AX280927 Sequence 


36 


514 


. 4 


45. 


4 


1805 


4 


AF164626 


AF164626 Canis fam 


37 


496 


. 2 


43. 


8 


597 


10 


AY255599 


AY255599 Mus muscu 


38 


329 


.2 


29. 


1 


382 


4 


AF499612 


AF499612 Ovis arie 


39 


304 


. 2 


26. 


8 


637 


10 


AF394597 


AF394597 Mus muscu 


40 


281 


.6 


24 . 


9 


328 


4 


AB092488 


AB092488 Bos tauru 


41 


263 


.2 


23 . 


2 


501 


4 


AF532967 


AF532967 Ovis arie 


42 


249 


.2 


22. 


0 


344 


9 


F202078S03 


AF20208 0 Homo sapi 


43 


249 


.2 


22. 


0 


9785 


6 


AR178605 


AR178605 Sequence 


44 


249 


.2 


22. 


0 


9785 


6 


AX088174 


AX088174 Sequence 


45 


249 


.2 


22. 


0 


9785 


9 


AY062030 


AY062030 Homo sapi 



ALIGNMENTS 



RESULT 1 
E43973 
LOCUS 

DEFINITION 
ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



DNA linear 
(HFGAN72Y) . 



PAT 31-JAN-2002 



(HFGAN72Y) 



E43973 1133 bp 

Novel G protein-coupled receptor 
E43973 

E43973.1 GI:18625172 
JP 2000106888-A/2. 
unidentified 
unidentified 
unclassified. 
1 (bases 1 to 1133) 
Bergsma,D.J. and Ellis / C.E. 
Novel G protein-coupled receptor 
Patent: JP 2000106888-A 2 18-APR-2000; 
SMITHKLINE BEECHAM CORP 
OS Unidentified 

JP 2000106888-A/2 
18-APR-2000 

21-JUL-1999 JP 1999206116 
30-APR-1997 US 08/846705 
DERK J BERGSMA, CATHARINE ELIZABETH ELLIS 

C12N15/09,A61K38/00,A61K38/00,A61K45/00,A61K4 8/00,A6lPl/00, PC 
A61P1/14, 

PC A61P9/02,A61P9/04,A61P9/10,A61P9/12,A6lPll/06, A61P13/02, PC 
A61P13/08, 

PC A61P19/10,A61P25/14,A61P25/16,A61P25/18,A61P25/22,A61P25/24, 
A61P31/04, 

A61P31/10, A61P31/12,A61P31/18,A61P33/00,A61P35/00,A61P37/08, 
A61P43/00, 

C07K14/705,C07K16/28,C12Nl/21,C12N5/10,C12P21/02,G01N33/566, 
G01N33/577// 

C12P21/08, (C12N15/09,C12R1:91) , (C12P21/02 , C12R1 : 91 ) , C12N15/00, 
A61K37/02, 

A61K37/02,C12N5/00, (C12N15/00, C12R1 : 91 ) 
Strandedness : Single; 
Topology: Linear; 

Key Location/Qualifiers 
source 1. .1133 

/organism^ 1 Unidentified 1 . 
FEATURES Location/Qualifiers 



PN 
PD 
PF 
PR 
PI 
PC 



PC 
PC 
PC 
PC 
PC 
PC 
PC 
PC 
CC 
CC 
FH 
FT 
FT 



source 1. .1133 

/organism= "unidentified" 
/mol_type= "genomic DNA" 
/db_xref="taxon: 32644" 

ORIGIN 

Query Match 99.9%; Score 1131.4; DB 6; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 2.2e-218; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I 

Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGGTATCTGTGGCGTGATTATCTG 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I . 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I II I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATGTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

Qy 541 GCAGTCATGGJ^ATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 601 GT CT GTGAT GAACGCT GGGC AGAT GAC CT CT AT CCCAAGAT CT AC CACAGTT GCT T CT T T 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



721 



721 



781 



781 



841 



841 



901 



901 



961 



961 



AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I | | M I I I I I I I I I I I 

CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 90 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GC AC G GAGGAAGACAG C CAAGAT GCT G 900 

ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I 
ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 102 0 



1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

1081 CT CAGT GGAT GT AAAGAGAAGAGT CT AGTT CT GT CCT GACCAT C GT GCC C C GG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 CT CAGT GGAT GT AAAGAGAAGAGT CTAGT T CT GT CCT GAC CAT CGT GCC C C GG 1133 



RESULT 2 
AX746120 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



AX746120 1133 bp DNA linear PAT 12-JUN-2003 

Sequence 3 from Patent EP1156110. 

AX746120 

AX746120.1 GI:31744926 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Bergsma, D. J. and Ellis, C.E. 
G-protein coupled receptor (HFGAN72Y) 
Patent: EP 1156110-A 3 21-NOV-2001; 
SMITHKLIN^ BEECHAM CORPORATION (US) 

Location/ Qualifiers 

1. .1133 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/note="HGS EST 557082" 



ORIGIN 



Query Match 99.9%; Score 1131.4; DB 6; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 2.2e-218; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 



0; 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I i I I I I I I I I I I I I I I I 

61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 T AC C CAAAACAGT AT GAGT GGGT C CT CAT C G C AG C CT AT GTGGCT GT GTT C GT C GT GGCC 180 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

421 GC C CT GGAC C GCT G GT AT GC C AT CT G C C AC C CACT AT T GT T CAAGAGC ACAG CCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I II I I I 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

541 GCAGTCATGG7\ATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

601 GT CT GT GAT GAAC GCT GG G C AGAT GAC CT CT AT C C CAAGAT CT AC CAC AGT TGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

661 AT T GT C AC CT AC CT G GC C C CACT GGG C CT C AT GGC CAT GGC CT AT T T CC AGAT AT T C C GC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 



Qy 

Db 



841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GC ACGGAG GAAGACAGC CAAGAT GCT G 900 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I l-l I I I 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAG'CGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I H I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 AAGAGGGTGTTCGGGATGTTCCGCGAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

1081 CT CAGT GGATGT AAAGAGAAGAGT CT AGT T CT GT C CT GACCAT CGTGCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1081 CT CAGT GGAT GT AAAGAGAAGAGT CT AGT T CTGT C CT GACCAT CGTGCCCCGG 1133 



RESULT 3 
BD185454 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BD185454 1133 bp DNA linear PAT 17-JUN-2003 

Human neuropeptide receptor. 

BD185454 

BD185454.1 GI: 31877654 

JP 2002360288-A/3. 

unidentified 

unidentified 

unclassified. 

1 (bases 1 to 1133) 

Soppet,D.R., Li , Y . and Rosen, C. A. 

Human neuropeptide receptor 

Patent: JP 2002360288-A 3 17-DEC-2002; 

HUMAN GENOME SCIENCES INC 

OS Unidentified 

PN JP 2002360288-A/3 

PD 17-DEC-2002 

PF 02-MAY-2002 JP 2002130838 

PI DANIEL R SOPPET,YI LI, CRAIG A ROSEN 

PC C12N15/09,A61K31/7088, A61K38/00, A61K45/00, A61K48/00, A61P3/04, 
PC A61P3/06, 

PC A61P3/10,A61P9/10,A61P9/12, A61P25/08, A61P25/18, A61P25/22, PC 
A61P25/28, 

PC A61P35/00,A61P43/00,C07K14/705, C07K16/24, C12N1/15, C12N1/19, PC 
C12N1/21, 

PC C12N5/10,C12Ql/68,C12N15/00,C12N5/00,A61K37/02 CC 

Strandedness : Single; 

CC Topology: Linear; 

CC Human neuropeptide receptor 

FH Key Location/Qualif iers 

FT source 1. .1133 

FT /organism= f Unidentified* . 

Location/Qualifiers 
1. .1133 

/organism="unidentified" 



/mol_type="genomic DNA" 
/db_xref =" taxon : 32 644 " 

ORIGIN 

Query Match 99.9%; Score 1131.4; DB 6; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 2.2e-218; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGACCCC 60 

Qy 61 T C C C CT GT GC CT C CAGACT AT GAAGAT GAGT T T CT C C GCT AT CT GTGGC GT GAT TAT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

v. 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GT CAT C C C CT AT CTAC AGGCT GT GT C C GT GT CAGT G GC AGT G CTAACT CTCAGCTT CAT C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GC AGT CAT G GAAT GCAGCAGT GT GCT GC CT GAG CT AGC CAAC CGCACACGGCT CT T CT C A 600 

I I I I I I I I I I I I I I I Mi? I | J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GC AGT CAT GGAAT GCAGCAGT GT GCT GC CT GAG CT AGC CAAC C GCACACGGCT CTT CT C A 600 

Qy 601 GT CT GT GATGAACGCTGGGCAGAT GACCT CT ATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I | | | | | | | 
Db 601 GT CT GT GAT GAAC GCTGGGCAGAT GAC CT CT AT C C CAAGAT CT AC C ACAGTTGCTT CT T T 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 



Db 



M > I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 -AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 7 80 



Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 

Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 C GC GCCTT CCT GGCT GAAGT GAAGCAGAT GC GT GC AC GGAGGAAGAC AGC CAAGAT GCT G 900 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I | | | 
Db 841 CGCGCCTT CCT GGCT GAAGT GAAGCAGAT GCGT GCACGGAGGAAGACAGCCAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I | I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 C T C AGT GGAT GT AAAGAGAAGAGT CT AGT TCTGTCCT GAC CAT CGTGCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1081 CT C AGT GGAT GTAAAGAGAAGAGTCTAGT T CT GT C CT GAC CAT C GT GC C CCGG 1133 



RESULT 4 

E43972 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



E43972 1170 bp 

Novel G protein-coupled receptor 
E43972 

E43972.1 GI:18625171 

JP 2000106888-A/l. 

unidentified 

unidentified 

unclassified. 

1 (bases 1 to 1170) 

Bergsma, D. J. and Ellis, C.E. 

Novel G protein-coupled receptor 



DNA linear 
(HFGAN72Y) . 



PAT 31-JAN-2002 



(HFGAN72Y) 



Patent: JP 2000106888-A 
SMITHKLINE BEECHAM CORP 
OS 
PN 
PD 
PF 
PR 
PI 



1 18-APR-2000; 



Unidentified 
JP 2000106888-A/l 
18-APR-2000 

21-JUL-1999 JP 1999206116 
30-APR-1997 US 08/846705 
DERK J BERGSMA, CATHARINE ELIZABETH ELLIS 



PC 



C12N15/09,A61K38/00, A61K38/00, A61K45/00, A61K48/00, A61P1/00, PC 
A61P1/14, 

PC A61P9/02, A6lP9/04,A61P9/10,A61P9/12,A61Pll/06,A61P13/02, PC 
A61P13/08, 

PC A61P19/10, A6lP25/14,A61P25/16,A61P25/18,A61P25/22,A61P25/24, 
PC A61P31/04, 

PC A61P31/10,A61P31/12, A61P31/18 , A61P33/00, A61P35/00, A61P37/08, 
PC A61P43/00, 



PC C07K14/705,C07K16/28,C12Nl/21,C12N5/10,C12P21/02,G01N33/566, 
PC G01N33/577// 

PC C12P21/08, (C12N15/09,C12R1:91) , (C12P21/02, C12R1 : 91 ) , C12N15/00 
PC A61K37/02, 

PC A61K37/02, C12N5/00, (C12N15/00, C12R1 : 91) 
CC Strandedness : Single; 
CC Topology: Linear; 

FH Key Location/Qualifiers 
FT source 1. .1170 

FT /organism^ 1 Unidentified 1 . 

FEATURES Location/Qualifiers 
source 1. .1170 

/organism="unidentif ied" 
/mol__type= 11 genomic DNA" 
/db_xref="taxon: 32644" 

ORIGIN 

Query Match 99.6%; Score 1128.2; DB 6; Length 1170; 

Best Local Similarity 99.7%; Pred. No. 9.6e-218; 

Matches 1130; Conservative 0; Mismatches 3; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I 1 I 
Db 1 AT GGAGC C CT CAGC C AC CC CAGGGG C C C AGAT GGGGGT C C C C CCT GG CAG CAGAGAGC C G 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1.1 I I I 
Db 61 T C C C CT GT GCCTC CAGACTAT GAAGAT GAGT T T CT C C GCT AT CTGTGGC GT GAT T AT CT G 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GT CAT C CC Cx AT CTAC AG GCT GT GT CCGT GT C AGT GGC AGT GCTAACT CT C AG CTT CAT G "*^4 2 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I IN I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I 1*1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I 
Db 421 GC C C T G GAC C GCT GGT AT GC CAT CTGC C ACC CACT ATT GT T CAAGAG CAC AGC C C GGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 



Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CT AC C ACAGT TGCTTCTTT 660 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GT CT GT GAT GAACGCT GGG C AGAT GAC CT CT AT C C CAAGAT CT AC C AC AGT TGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 CGCGCCTT C CT GGCTGAAGT GAAGCAGAT GCGT GCACGGAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

Qy 1081 CTCAGT GGATGTAAAGAGAAGAGT CT AGT TCT GT C CT GAC CAT CGTGCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CTCAGTGGATGTAAAGAGAAGAGTCTAGCTCTGTCCTGCCCATCGTGCCCCGG 1133 
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AX746118 
Sequence 
AX746118 
AX746118. 



1170 bp 
1 from Patent EP1156110. 

1 GI:31744924 



DNA 



linear 



PAT 12-JUN-2003 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Bergsma,D.J. and Ellis, C.E. 
G-protein coupled receptor (HFGAN72Y) 
Patent: EP 1156110-A 1 21-NOV-2001; 
SMITHKLINE BEECHAM CORPORATION (US) 



FEATURES Location/Qualifiers 
source 1. .1170 

/organism="Horno sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 9606" 
gene 1. .1170 

/ gene="HFGAN72Y" 
CDS 1. .1170 

/ gene="HFGAN72Y" 

/codon_start=l 

/protein_id="CAD97474 . 1" 

/db_xref="GI : 31744925" 

/translation="MEPSATPGAQMGVPPGSREPSPVPPDYEDEFLRYLWRDYLYPKQ 
YEWLIAAWAVFWALVGNTLVCIAWRNHHMRTVTNYFIWLSLADVLVTAICLPA 
SLLVDITESWLFGHT^LCKVIPYLQAVSVSVAVLTLSFIALDRWYAICHPLLFKSTARR 
ARGSILGIWAVSIJVI1WPQ7\AVMECSSVLPE]^RTRLFSVCDERWADDLYPKIYHSC 
FFIVTYLAPLGLMAMAYFQIFRKLWGRQIPGTTSALVRNWKRPSDQLGDLEQGLSGEP 
Q P RGRAFLAEVKQMRARRKTAKMLMWLLVFALC YL P I S VLNVLKRVFGMFRQAS DRE 
AVYACFTFSHWLWANSAANPIIYNFLSGCKEKSLALSCPSCPGHDPHLAAALCS" 

ORIGIN 

Query Match 99.6%; Score 1128.2; DB 6; Length 1170; 

Best Local Similarity 99.7%; Pred. No. 9.6e-218; 

Matches 1130; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACC CAAAACAGT AT GAGT GGGT C CT C AT CGC AGC CT ATGT GGCT GT GT T C GT C GT GGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I II I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCT^ACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCT&CTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG , 3(30 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GC C CT GGAC C GCT G GT AT GC CAT C T GC CAC C CAC TAT T GTT CAAGAG C ACAGC C C GGCGG 480 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 



Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

■ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAGTCAT GGAAT GCAGCAGT GT GCT GCCTGAGCTAGCCAACCGCACAC GGCT CTTCT CA 600 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. 
Db 601 GT CT GT GAT GAAC GCT GGGC AGAT GAC CT CTAT CCCAAGAT CT AC CACAGTT GCT T CT TT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 CGCGCCTT CCT GGCT GAAGT GAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCTGGCT GAAGT GAAG CAGAT GCGTGCAC GGAGGAAGACAGC CAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mi 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

M M M M M M M M M I M I M M M I M M M I M M I M M M M M M M M M I 

Db .961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

M M M M I M M M M M M I M M M M M M M M I I M M M M M M M M M M 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CT CAGT G GAT GT AAAGAGAAGAGT CT AGTTCT GTCCT GAC CAT CGTGCCCCGG 1133 

M I M M M M M I M M M M M M M M M M M I I M M M M M M I 

Db 1081 CT CAGT GGAT GT AAAGAGAAGAGT CTAGCT CT GT C CT GC C CAT CGTGCCCCGG 1133 
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AR216119 
Sequence 
AR216119 
AR216119. 



1116 bp 
5 from patent US 6410701. 

1 GI:23314432 



Unknown . 

Unknown. 

Unclassified. 

1 (bases 1 to 1116) 

Soppet,D.R., Li,Y. and Rosen, C. A. 



DNA 



linear PAT 25-SEP-2002 



TITLE Human neuropeptide receptor 

JOURNAL Patent: US 6410701-A 5 25-JUN-2002; 
FEATURES Location/Qualifiers 
source 1. .1116 

/organism= "unknown" 
/mol__type="genornic DNA" 

ORIGIN 

Query Match 98.4%; Score 1114.4; DB 6; Length 1116; 

Best Local Similarity 99.9%; Pred. No. 5.9e-215; 

Matches 1115; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I Ml 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGACCCC 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCC7W\ACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CT GGT GG GCAAC AC GCT GGT CTGCCTGGCCGT GTGGCGGAACCAC C AC AT GAGGACAGT C 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACC7\ACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

I I I I I I I I I I PI I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I Pi I I II 1 1 I 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I 1 1 1 1 I 1 1 1 1 1 1 1 1 Mr" 

Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GCAGT CATGGAATGCAGCAGTGT GCT GCCT GAGCTAGCCAACCGCACACGGCT CTT CTCA 600 

I M I I M I I M I I I M I II I I I I II I I II I II I I || I I I II I II I II I I I I I II II II I I 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCT GCCT GAGCTAGCCAACCGCACACGGCT CTT CTCA 600 

Qy 601 GTCT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CTAC C AC AGT T GCT T CTTT 660 

Mill II I I II II II I M I I I I I | | | | | | | | | | | | | | | | | || | | | | | | | | | | | | 

Db 601 GT CTGT GAT GAAC GCT GGGCAGAT GAC CT CT AT CC CAAGAT CTAC C AC AGTT GCTTCTTT 660 



Qy 



661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCT.GGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGGCCCGGGGC 84 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 



Qy 1081 CT C AGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT CC 1116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CT CAGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT CC 1116 
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ORIGIN 



AR216117 1209 bp DNA 

Sequence 1 from patent US 6410701. 
AR216117 

AR216117.1 GI:23314430 

Unknown . 

Unknown . 

Unclassified. 

1 (bases 1 to 1209) 

Soppet,D.R., Li, Y. and Rosen, C. A. 

Human neuropeptide receptor 

Patent: US 6410701-A 1 25- JUN-20G2 : ; 

Location/Qualif iers 

1. .1209 

/organism="unknown" 
/mol_type= 11 genomic DNA" 



linear. PAT 25-SEP-2002 



Query Match 95.9%; Score 1086.4; DB 6; Length 1209; 

Best Local Similarity 99.9%; Pred. No. 2.7e-209; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 T C C C CT GT GC CT CCAGACTAT GAAGAT GAGT TT CT C C GCT AT CT GT GGCGT GAT TAT CT G 12 0 

121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

181 CT GGT GG GCAAC ACGCTG GTCT GCCTGGC C GT GT G G C G GAAC C AC CAC AT GAGGACAGT C 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 GT CAT CC C CT AT CT ACAGGCT GT GT CC GT GT C AGT G G CAGT GCTAACT CT CAGCTTC AT C 420 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

I I I I I I I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GCAGT CAT G GAAT GCAGCAGT GT GCT GC CT GAGCT AGC CAAC C GCAC AC GGCT CTT CT CA 600 

601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 GT CT GT GAT GAAC GCT GGGC AGATGACCT CT AT C C CAAGAT CT AC CAC AGT T GCTT CTTT 660 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

i i I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ATT oT CAC CT AC CT G GCCC C ACTGGGC CT CAT GG C CAT GGC CT AT T T C CAGAT ATa'C CGC 720 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 
I M I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 



Db 



841 CGCGCCTTC CT GGCT GAAGT GAAGCAGAT GC GT GCAC G GAGGAAGAC AGC CAAGAT GCTG 900 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 102 0 

1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

1081 CTCAGTGG 1088 

I I I I I I I I 
1081 CTCAGTGG 1088 



RESULT 8 

E43974 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



E43974 1564 bp DNA linear PAT 31-JAN-2002 

Novel G protein-coupled receptor (HFGAN72Y) . 

E43974 

E43974.1 GI:18625173 

JP 2000106888-A/3. 

unidentified 

unidentified 

unclassified. 

1 (bases 1 to 1564) 

Bergsma, D. J. and £1115,0. E. 

Novel G protein-coupled receptor (HFGAN72Y) 

Patent: JP 2000106888-A 3 18-APR-2000; 

SMITHKLINE BEECHAM CORP 

OS Unidentified 

PN JP 2000106888-A/3 

PD 18-APR-2000 

PF 21-JUL-1999 JP 1999206116 

PR 30-APR-1997 US 08/846705 

PI DERK J BERGSMA, CATHARINE ELIZABETH ELLIS 

PC C12N15/09,A61K38/00,A61K38/00,A61K45/00,A61K48/00,A61Pl/00, PC 
A61P1/14, 

PC A61P9/02,A61P9/04,A6lP9/10,A61P9/12,A61Pll/06,A61P13/02, PC 
A61P13/08, 

PC A61P19/10,A61P25/14,A61P25/16,A61P25/18,A61P25/22,A61P25/24, 
A61P31/04, . ^ 

A61P31/10,A61P31/12,A61P31/18,A61P33/00, A61P35/00, A61P37/08, 
A61P43/00, 

C07K14/705,C07K16/28,C12N1/21, C12N5/10, C12P21/02, G01N33/566, 
G01N33/577// 

C12P21/08, (C12N15/09,C12R1:91) , ( C12P21/02 , C12R1 : 91 ) , C12N15/ 00 , 
A61K37/02, 

A6lK37/02,Cl2N5/00, (C12N15/00, C12R1 : 91) 
Strandedness : Single; 
Topology: Linear; 

Key Location/Qualifiers 
source 1. .1564 



PC 
PC 
PC 
PC 
PC 
PC 
PC 
PC 

cc 
cc 

FH 
FT 



FT /organism= f Unidentified' . 

FEATURES Location/Qualifiers 
source 1. .1564 

/ organism="unidentif ied" 
/mol_type="genomic DNA" 
/db_xref="taxon: 32644" * 

ORIGIN 

Query Match 95.9%; Score 1086.4; DB 6; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 2.6e-209; ■ 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 AT GGAGCC CT C AGCCAC C C CAGGG GC C C AGAT GGGGGTCCCCC CTGGC AGC AGAGAGC C C 60 

I I I I I I I II I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

- - r I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I -i i I I I I I I I I I I I I I I 

Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GT CT GT GAT GAACGCT GGGCAGAT GAC CT CT AT C C CAAGAT CT ACCAC AGTT GCTT CT T T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I 

Db 754 GT CTGTGAT GAACGCT GGGCAGAT GAC CT CTATC C CAAGAT CT ACCAC AGTT GCTT CTTT 813 



Qy 



661 



ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 



720 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 87 4 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCTGGCT GAAGTGAAGC AGAT GCGT GCAC GGAGGAAGACAGC CAAGAT G CT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 994 CGCGC CT T C CT G GCT GAAGT GAAGC AGAT GCGTGC AC GGAGGAAGACAGC CAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 



RESULT 9 

E50810 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



E50810 1564 bp DNA linear PAT 18-JUN-2001 

Novel G protein-bound receptor (HFGAN 72X) . 

E50810 

E50810.1 GI:13023197 

JP 2000060578-A/l. 

unidentified 

unidentified 

unclassified. 

1 (bases 1 to 1564) 

Derk,J.B. and Catharine, E . E . 

Novel G protein-bound receptor (HFGAN 72X) 

Patent: JP 2000060578-A 1 29-FEB-2000; 

SMITHKLINE BEECHAM CORP 

OS Unidentified 

PN JP 2000060578-A/l 

PD 29-FEB-2000 

PF 21-JUL-1999 JP 1999206115 

PR 30-APR-1997 US 08/846704 

PI DERK J BERGSMA, CATHARINE ELIZABETH ELLIS 

PC C12N15/09,A61K31/70,A6lK38/00,A6lK39/00, A61K39/395, A61K39/395, 
PC A61K45/00, 

PC A61K48/00, A61P3/04,A61P9/00,A61P11/06,A61P13/00,A61P25/00, PC 
A61P25/16, 



FEATURES 

source 



ORIGIN 



PC A61P25/18,A61P25/20,A61P25/22,A61P31/04, A61P31/10, A61P31/12, 
PC A61P31/18, - 

PC A61P35/00 / A61P37/00 f C07K14/705,Cl2N5/10 / C12P21/02 / Cl2Ql/02 / PC 
G01N33/53, 

PC G01N33/566//C07K16/28,C12N15/00,A61K37/02,C12N5/00 CC 
Strandedness : Single; 
CC Topology: Linear; 

FH Key Location/Qualifiers 
FT source 1. .1564 

FT /organism= 'Unidentified 1 . 

Location/Qualifiers 
1. .1564 

/organism="unidenti f ied" 
/mol_type=" genomic DNA" 
/db xref="taxon: 32644" 



Query Match 95.9%; Score 1086.4; DB 6; 

Best Local Similarity 99.9%; Pred. No. 2.6e-209; 
Matches 1087; Conservative 0; Mismatches 1; 



Length 1564; 
Indels 0; Gaps 



0; 



Qy 



Db 



154 



ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
AT GGAGC CCT CAGC CACC CC AGGG GC C CAGAT G GGG GT C C C C C CT GGC AGCAGAGAG CCG 213 



Qy 



Db 



61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

214 T CC C CT GT GCCT CC AGACT AT GAAGAT GAGTT T CT C CGCT AT CT GT G GC GT GATTAT CT G 273 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



121 



274 



181 



TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 
TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 



240 



CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 
361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 



Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 694 GCAGTCAT GGAAT GCAGCAGTGT GCT GC CT GAGCT AGCCAACCGCACACGGCT CTT CT CA 753 

Qy 601 GT CT GT GAT GAAC GCT GGGC AGAT GAC CT CT AT C C C AAGAT CT AC C AC AGT TGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 754 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CT AC C AC AGT TGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I II I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCTGGCT GAAGT GAAGC AG AT G C GT GCAC G GAGGAAGACAGC CAAGAT GCT G 900 

I I II I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 994 CGCGCCT TCCTGGCT GAAGTGAAG C AGAT G C GT GCAC GGAGGAAGACAGC CAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCT^ACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 



RESULT 10 

E50811 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



E50811 1564 bp DNA linear 

Novel G protein-bound receptor (HFGAN 72X) . 

E50811 . •- ' 

E50811.1 GI:13023198 

JP 2000060578-A/2. 

unidentified 

unidentified 

unclassified. 

1 (bases 1 to 1564) 

Derk,J.B. and Catharine, E . E . 

Novel G protein-bound receptor (HFGAN 72X) 

Patent: JP 2000060578-A 2 29-FEB-2000; 

SMITHKLINE BEECHAM CORP 

OS Unidentified 



PAT 18-JUN-2001 



FEATURES 

source 



ORIGIN 



PN JP 2000060578-A/2 

PD- 29-FEB-2000 

PF 21-JUL-1999 JP 1999206115 

PR 30-APR-1997 US 08/846704 

PI DERK J BERGSMA, CATHARINE ELIZABETH ELLIS 

PC C12N15/09, A61K31/70,A61K38/00,A6lK39/00,A61K39/395,A61K39/395, 
PC A61K45/00, 

PC A61K48/00, A61P3/04,A61P9/00,A61P11/06,A61P13/00, A61P25/00, PC 
A61P25/16, 

PC A61P25/18, A61P25/20,A61P25/22,A61P31/04,A61P31/10,A61P31/12, 
PC A61P31/18, 

PC A61P35/00,A61P37/00,C07K14/7 05,C12N5/10,C12P21/02,C12Q1/02, PC 
G01N33/53, 

PC G01N33/566//C07K16/28,C12N15/00,A61K37/02,C12N5/00 CC 
Strandedness : Single; 
CC Topology: Linear; 

FH Key Location/Qualifiers 
FT source 1. .1564 

FT /organism= Unidentified 1 . 

Location/Qualifiers 
1. .1564 

/organism^ "unidentified" 
/mol_type=" genomic DNA" 
/db xref="taxon: 32644" 



Query Match 95.9%; 
Best Local Similarity 99.9%; 
Matches 1087; Conservative 



Score 1086.4; DB 6; 
Pred. No. 2.6e-209; 
0; Mismatches 1; 



Length 1564; 
Indels 0; Gaps 



0; 



Qy 



Db 



154 



ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GGAG C C CT C AGC CAC C C CAGGG GC C CAGAT GGGGGTCCC CC CT GGC AGC AGAGAGC C G 213 



Qy 



Db 



61 TCCCCTGTGCCTC CAGACT AT GAAGAT GAGT TT CTCC GCT AT CT GT G GC GT GATT AT CT G 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

181 CTGGTGGGC7\ACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

241 ACCAACTACTTCATTGTC7VACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

301 C C GG C CAG CCT GCT GGTGGACATCACT GAGT CCTGGCTGTTC GGC CAT GCCCTCTGCAAG 360 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 



Qy 

Db 



361 
514 



GT CAT CCCCTATCTACAG GCT GTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTT CATC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 



420 
573 



Qy 

Db 



421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 



QY 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 



541 



600 



GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
694 GCAGTCAT GGAATGCAGCAGTGT GCT GCCTGAGCTAGCCAAC CGCACACGGCT CTTCTCA 753 

601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
754 GT CT GT GATGAACGCT GGGCAGAT GACCT CTATCCCAAGAT CTACCACAGTT GCTTCTTT 813 



661 



720 



ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 



721 



780 



AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 
I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGC'GC 933 

I 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCGCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
994 C GC GC CTTCCT GGCT GAAGT GAAGCAGAT GCGT GC AC G GAGGAAGACAGC CAAGAT GCT G 1053 



901 



960 



ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

1081 CTCAGTGG 1088 

I I I I I I I I 
1234 CTCAGTGG 1241 



RESULT 11 

AX299473 

LOCUS 

DEFINITION 
ACCESSION 
VERSION 
KEYWORDS 



AX299473 1564 bp 

Sequence 1 from Patent EP1154019. 
AX299473 

AX2 99473. 1 GI: 1712 9230 



DNA 



linear PAT 26-NOV-2001 



SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



Homo sapiens (human) 
Homo sapiens - 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Bergsma,D.J. and Ellis, C.E. 
G-protein coupled receptor (hfgan72x) 
Patent: EP 1154019-A 1 14-NOV-2001; 
SmithKline Beecham Corporation (US) 

Location/Qualif iers 

1. .1564 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 95.9%; 
Best Local Similarity 99.9%; 
Matches 1087; Conservative 



Score 1086.4; DB 6; 
Pred. No. 2.6e-209; 
0; Mismatches 1; 



Length 1564; 
Indels 0; Gaps 



0; 



Qy 



Db 



154 



ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 



Qy 



Db 



61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 



Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | 

Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 



Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ill I I I I I I I I I I I I I I I I I I I II I I I I 
Db 514 GT CAT C CCCT ATCTACAGGCTGTGTCCGTGTCAGT GGCAGT GCTAACT CT CAGCTTCAT C 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
Db . 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 



Qy 



541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 



Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 



Qy 601 GT CT GTGAT GAACGCT GGGCAGAT GACCT CTAT CCCAAGAT CTACCACAGTT^GCTT CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 754 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 



Qy 841 CGCGCCTT CCT GGCT GAAGT GAAGCAGAT GCGT GCACGGAGGAAGACAGCCAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 9 94 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCC7\ACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 



RESULT 12 

AX299475 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 



AX299475 1564 bp DNA linear PAT 26-NOV-2001 

Sequence 3 from Patent EP1154019. 

AX299475 

AX299475-A GI:17129231 . 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Bergsma,D.J. and Ellis, C.E. 
G-protein coupled receptor (hfgan72x) 
Patent: EP 1154 019-A 3 14-NOV-2001; 
SmithKline Beecham Corporation (US) 
Location/Qualifiers 



source 1. .1564 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 95.9%; Score 1086.4; DB 6; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 2.6e-209; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II I I I I I I II I I I I I 

Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTC CAGACT AT GAAGAT G AGT T T CT C C GCTAT CT GT GGC GT GAT TAT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCGCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I 

Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CTAT CC CAAGAT CT ACC ACAGTT GCTT CT TT 660 

I I I I I I I I I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 754 GT CT GT GAT GAAC G CT GGGCAGAT GAC CT CTAT C C CAAGAT CT ACCAC AGTT GCTT CTT T 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



721 



874 



781 



934 



841 



994 



901 



AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 

CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 



780 



933 



840 



993 



900 



CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

CGCGCCTTCCTGGCT GAAGT GAAG CAGAT GCGT GCAC G GAGGAAGACAG CCAAGAT GCT G 1053 



960 



ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I II 
1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

1081 CTCAGTGG 1088 

I I I I I I I I 
1234 CTCAGTGG 1241 



RESULT 13 

AX549082 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 



JOURNAL 

FEATURES 

source 



ORIGIN 



AX549082 1564 bp DNA linear PAT 26-NOV-2002 

Sequence 367 from Patent WO02061087. 

AX549082 

AX549082.1 GI:25813851 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Burmer,G.C, Roush,C.L. and Brown, J. P. 

Antigenic peptides, such as for G protein-coupled receptors 
(GPCRs), antibodies thereto, and systems for identifying such 
antigenic peptides ; '" 
Patent: WO 02061087-A 367 08-AUG-2002; 
Lifespan Biosciences, Inc. (US) 

Location/Qualifiers 

1. .1564 

/organism="Homo sapiens" 
/mol__type="unas signed DNA" 
7db xref='*taxon: 9606" 



Query Match 95.9%; Score 1086.4; DB 6; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 2.6e-209; 



Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I 

Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GTCT GT GAT GAACGCTGGGCAGAT GAC CT CT AT C C CAAGAT CT AC C AC AGT T GCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 754 GTCT GT GAT GAACGCTGGGCAGAT GAC CT CT AT C C CAAGAT CT AC C AC AGT TGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I 
Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84^0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 



Qy 841 CGCGCCTT C CT GGC T GAAGT GAAG CAGAT GC GT GC AC G GAGGAAGACAG C CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 994 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I II I I I I I 

Db 1234 CTCAGTGG 1241 



RESULT 14 

AX746121 
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ORIGIN 



AX746121 1564 bp DNA linear PAT 12-JUN-2003 

Sequence 4 from Patent EP1156110. 

AX746121 

AX746121.1 GI: 31744927 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Bergsma,D.J. and Ellis, C.E. 
G-protein coupled receptor (HFGAN72Y) 
Patent: EP 1156110-A 4 21-NOV-2001; 
SMITHKLINE BEECHAM CORPORATION (US) 

Location/ Qualifiers 

1. .1564 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/note="HGS EST 554692" 



Query Match 95.9%; 
Best Local Similarity 99.9%; 
Matches 1087; Conservative 



Score 1086.4; DB 6; 
Pred. No. 2.6e-209; 
0; Mismatches 1; 



Length 1564; 
Indels 0; Gaps 



0; 



Qy 



Db 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II I I II I I I I I I 
154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 



Qy 

Db 



61 T CCCCT GT GCCTC CAGACT AT GAAGAT GAGT T T CT C C GCT AT CT GT GGC GT GAT TAT CT G 12 0 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
214 T CCCCT GT GCCTC CAGACT AT GAAGAT GAGT TT CT C C G CT AT CT GT GGC GT GAT TAT CT G 273 



/ 



121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 

334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I * 
394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 54 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
514 GTCAT CCCCT ATCTACAGGCT GT GT CCGT GTCAGT GGCAGT GCTAACT CT CAGCTT CAT C 573 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTC7VAGAGCACAGCCCGGCGG 633 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

601 GT CT GT GAT GAACGCT GGGCAGAT GACCT CT AT CCCAAGAT CT AC C AC AGTT GCTT CT T T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

754 GT CT GT GATGAAC GCT G GGCAGAT GAC CT CT AT C C CAAGAT CT AC C AC AGTT GCTT CT T T 813 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

841 C GC GCCTT CCT GGCT GAAGT GAAGCAGAT GC GT G CAC GGAGGAAGAC AGCCAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

994 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 1053 

901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 

1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 



Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

- I I I I I I I I I I I I I I I I I I I I I I I I I H I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 
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AX840912 
Sequence 8 
AX840912 
AX840912.1 



1564 bp 
from Patent WO03075945. 

GI:39979051 



DNA 



linear PAT 16-DEC-2003 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Eulenberg, K. , Steuernagel, A. , Haeder,T. and Broenner f G. 
Cg8327 / cgl0823, cgl8418, cgl5862, cg3768, cgll447 and cgl6750 
homologous proteins involved in the regulation of energy 
homeostasis 

Patent: WO 03075945-A 8 18-SEP-2003; 

DeveloGen Aktiengesellschaf t fuer entwicklungsbiologische; 
For s chung (DE) 

Location/Qualifiers 

1. .1564 

/organism="Homo sapiens" 
/mol__type="unas signed DNA" 
/db xref="taxon:9606" 



Query Match 95.9%; Score 1086.4; DB 6; 

Best Local Similarity 99.9%; Pred. No. 2.6e-209; 
Matches 1087; Conservative 0; Mismatches 1; 



Length 1564; 
Indels 0; Gaps 



0; 



Qy 

Db" 



154 



ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 



Qy 



Db 



61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 1 I I 
214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 



Qy 



Db 



121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I M I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 



Qy 



181 



CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 
I I I I I I I I I I I I I I M I I I I I I I I I I I I | M I I I I I I I M I I I I I I I II I I I I I I I I I I I 



Db 334 CT GGT GGGCAACACGCT GGT CT GCCT GGCCGT GT GGCGGAACCACCACATGAGGACAGT C 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | I I | I I I I | I | I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTC7W\GAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGT CAT GGAATGCAGCAGTGT GCTGCCTGAGCT AGCCAACCGCACACGGCT CTT CTCA 600 

I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GT CT GT GAT GAACGCT GG GCAGAT GACCTCTAT C C CAAGAT CT ACC ACAGT T GCT T CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 754 GT CT GT GAT GAACGCT G GGC AGAT GACCT CT AT C C CAAGAT CT ACC AC AGT TGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTT C CT GGCT GAAGT GAAGCAGAT GC GT GC AC G GAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 994 CGCGCCTT C CT GGCT GAAGT GAAGCAGAT GC GT GC AC G GAGGAAGACAGC CAAGAT GCTG 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 



- . Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 
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ALIGNMENTS 



RESULT 1 
AAS00493 

ID AAS00493 standard; cDNA; 1133 EPV 
XX 

AC AAS00493; 
XX 

DT 17-MAY-2001 (first entry) 
XX 

DE Human neuropeptide receptor splice variant 2 cDNA. 
XX 

KW Human; neuropeptide receptor; neuropeptide Y receptor; obesity; 

KW nervous system disorder; hyperprolif erative disorder; diabetes mellitus; 

KW cardiovascular disorder; autoimmune disorder; infectious disorder; 

KW eating behaviour disorder; narcolepsy; neurological disease; 



KW narcotics addiction; nicotine addiction; alcohol addiction; gene therapy; 

KW protein co-ordinate data; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualif iers 

FT CDS 1. .1119 

FT /*tag= a 

FT /product^ "neuropeptide receptor splice variant 2" 
XX 

PN WO200117532-A1. 
XX 

PD 15-MAR-2001. 
XX 

PF 07-SEP-2000; 2000WO-US024518 . 
XX 

PR 10-SEP-1999; 99US-00393696 . 
XX 

PA (HUMA-) HUMAN GENOME SCI INC. 
XX 

PI Soppet DR, Li Y, Rosen CA; 
XX 

DR WPI; 2001-183276/18. 

DR P-PSDB; AAU00440. 
XX 

PT A new nucleic acid encoding a human neuropeptide receptor polypeptide, 

PT useful for preventing, treating or ameliorating obesity, narcolepsy, 

PT neurological disease and addiction to narcotics, nicotine and alcohol. 
XX 

PS Claim 4; Fig 3; 385pp; English. 
XX 

CC The present sequence encodes for human neuropeptide receptor splice 

CC variant 2. Two splice variants (AAU00439-AAU00440) and a possible mutant 

CC (AAU00442) of a novel human neuropeptide receptor (AAU00438) are 

CC described. The neuropeptide receptor shows sequence homology to the 

CC neuropeptide Y receptor. Polypeptides and polynucleotides of the 

CC neuropeptide receptor are useful for diagnosing, preventing, or treating 

CC a pathological condition in a subject related to the central nervous and 

CC peripheral nervous systems (CNS and PNS) . The polypeptides and 

CC polynucleotides may be used to treat hyperprolif erative, cardiovascular, 

CC autoimmune, nervous system or infectious disorders e.g. cancer, heart 

CC disease, rheumatoid arthritis, Alzheimer's disease, HIV infection and 

CC diabetes mellitus . In particular they are useful for preventing, treating 

CC or ameliorating a medical condition in a mammal such as obesity/eating 

CC behaviour disorders, narcolepsy, neurological disease, addiction to 

CC narcotics, nicotine and alcohol, chronic pain, acute pain, migraine 

CC headaches and anxiety disorders. The polynucleotides encoding the 

CC neuropeptide receptor can also be used in gene therapy methods for 

CC treating such diseases 

XX 

SQ Sequence 1133 BP; 202 A; 367 C; 313 G; 251 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1133; DB 4; Length 1133; 
Best Local Similarity 100.0%; Pred. No. 1.8e-263; 

Matches 1133; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 


l 


ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 


60 


Qy 


61 


TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 


120 






1 1 II 1 1 1 1 1 1 1 I 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I | |.| | | | | | | | 




Db 


61 


TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 


120 


Qy 


Iz 1 


1ACLLAAAACAG1ATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 


180 


Db 


121 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 


180 


Qy 


TOT 

lol 


CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 


240 






1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | | | | | | | | | | 




Db 


181 


CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 


240 


Qy 


o /l n 
z4 1 


ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 


300 






1 1 1 1 1 1 I.I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l-l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 




Db 


241 


ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 


300 


Qy 


301 


CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 


360 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I 




Db 


301 


CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 


360 


Qy 


361 


GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 


420 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


361 


GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 


420 


Qy 




GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 


480 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


GCCCT GGAC C GCT G GT AT GC C AT CT GC CAC CCACT ATT GT T CAAGAG CACAG CCCGGCGG 


480 


Qy 


4 D 1 


GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 


540 






1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 u 1 1 1 




Db 


481 


GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 


540 


Qy 




GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 


600 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | M 1 1 1 




Db 


541 


GCAGT CAT GGAAT GCAGCAGTGT GCTGCCTGAGCT AGC CAACCGCACACGGCT CTTCT CA 


600 


Qy 


bUl 


GT CT GT GAT GAAC GCT GGGCAGAT GACCT CT ATCC CAAGAT CT ACC ACAGTT GCTTCTTT 


660 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


601 


GT CT GT GAT GAACGCT G GGC AGAT GAC CT CT AT CCCAAGAT CT AC CACAGT TGCTTCTTT 


660 


Qy 


ool 


ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 


720 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I 




Db 


661 


AT T GT CAC CT AC CT G GC C C C ACT GGGCCT CATGGCC AT GGC CT AT TT C C AGAT AT T C C GC 


720 


Qy 


/ <£ 1 


AAbu 1 0 1 CjGGGCLGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 


780 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 


780 


Qy 


781 


CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 


840 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 


840 


Qy 


841 


CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 


900 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 



841 CG CGCCTT CCT GG CT GAAGT GAAGC AGAT GC GT G CACGGAGGAAGACAGC CAAGAT GCT G 900 



Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CT C AGT GGAT GT AAAGAGAAGAGT CT AGT T CT GT C CT GAC CAT CGT G C C C C G G 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 C T C AGT GGAT GT AAAGAGAAGAGT CT AGT T CT GT C CT GAC CAT CGT GC C C C GG 1133 



RESULT 2 
AAT42828 

ID AAT42828 standard; cDNA; 1133 BP. 
XX 

AC AAT42828; 
XX 

DT 22-FEB-1997 (first entry) 
XX 



DE Neuropeptide receptor splice variant-2 gene. 
XX 

KW Human; neuropeptide receptor; splice variant; drug screening; 

KW receptor-agonist; receptor-antagonist; anorectic; antitumour; 

KW anticholesterolemic; neuroprotective; anticonvulsant; hypotensive; 

KW sedative; diagnostic; gene therapy; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 
FT misc_feature 1117. .1119 
FT /*tag= a 

FT /note= "In-frame stop codon" 

XX 

PN W09634877-A1. 
XX 

PD 07-NOV-1996. 



XX 

PF 05-MAY- 1995; 95WO-US005616 . . 
XX 

PR 05-MAY-1995; 95WO-US005616 . 
XX 

PA (HUMA-) HUMAN GENOME SCI INC. 
XX 

PI Soppet DR, Li Y, Rosen CA; 
XX 

DR WPI; 1996-506094/50. 

DR P-PSDB; AAW06126. 
XX 

PT Human neuro-peptide receptor polypeptide (s ) - used to identify 



PT antagonists and agonists to such polypeptide ( s ) , e.g. in the treatment of 

PT obesity, Alzheimer f s disease, epilepsy, etc. . 

XX 

PS Disclosure; Page 52; 77pp; English. 
XX 

CC The sequence encodes human neuropeptide receptor splice variant-2, which 

CC retains activity corresponding to the mature receptor (encoded by 

CC AAT42826) . The receptor gene has been isolated from from a human adult 

CC hypothalamus cDNA library, and is structurally related to the G-protein- 

CC coupled receptor family. The receptor may be used in a drug screening 

CC assay for isolation of receptor-agonists and -antagonists, which may be 

CC used as anorectic, antitumour, anticholesterolemic, neuroprotective, 

CC anticonvulsant, hypotensive or sedative drugs, etc. The DNA may also be 

CC used in genetic disease diagnosis or gene therapy. The receptor and its 

CC corresponding antibody may also be used in therapy and diagnosis 
XX 

SQ Sequence 1133 BP; 202 A; 368 C; 312 G; 251 T; 0 U; 0 Other; 



Query Match 99.9%; Score 1131.4; DB 2; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 4.5e-263; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0 



Qv 


1 


ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 


60 






1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 




Db 


1 


ATGGAGCCCTCAGCCACCCCAGGGGCC'CAGATGGGGGTCCCCCCTGGCAGCAGAGACCCC 


60 


Qy 


61 


TCCCCTGTGCCTC CAGACT AT GAAGAT GAGT T T CT C C GCTAT CT GT GGCGT GAT TAT CT G 


120 






1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


61 


TCCCCTGTGCCTC CAGACT AT GAAGAT GAGT T T CT C C GCTAT CT GT G G C GT GAT TAT CT G 


120 


Qy 


121 


TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I I | 




Db 


121 


TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 


180 


Qy 


181 


CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 


240 






1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 


240 


Qy 


241 


ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 


300 






1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 




Db 


241 


ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 


300 


Qy 


301 


CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 


360 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 


360 


Qy 


361 


GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 


420 






1 1 1 1 1 f 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 


420 


Qy 


421 


GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 


480 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 


480 


Qy 


481 


GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 


540 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 




Db 


481 


GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 


540 



Qy -541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

i ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GT CT GT GATGAAC G CT GGGC AGAT GAC CT CT AT C C CAAGAT CT AC CACAGT TGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 601 GT CT GT GAT GAAC GCT GGGC AGAT GAC CT CTAT C C CAAGAT CT AC CACAGT TGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db ' 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCT GGCT GAAGT GAAGCAGAT GC GT GCACGGAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT G C GT GC AC GGAGGAAGACAGC CAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 

Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I II I II I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CT C AGT GGAT GT AAAGAGAAGAGT CT AGT T CT GT C CT GAC CAT C GT GC C C C G G 1133 

I I I I I I I I I I I I I I I I I' I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1081 CT C AGT GGAT GTAAAGAGAAGAGT CTAGT T CT GT C CT GAC CAT C GTGC C CCGG 1133 



RESULT 3 
AAV68512 

ID AAV68512 standard; cDNA; 1133 BP. 
XX 

AC AAV68512; 
XX 

DT 29-JAN-1999 (first entry) 
XX 

DE Nucleotide sequence of HGS EST 557082. 
XX 

KW HGS EST 557082; G-protein coupled receptor family; HFGAN72Y; mutation; 

KW probe; agonist; antagonist; activation; inhibition; gene therapy; 

KW antibody; immune response; vaccine; HIV-l; HIV-2; cancer; anorexia; 

KW bulimia; asthma; Parkinson's disease; acute heart failure; hypotension; 

KW hypertension; urinary retention; osteoporosis; angina pectoris; 



KW myocardial infarction; ulcer; allergies; psychotic disorder; 

KW neurological disorder; gene mapping; ss. 

XX 

OS Homo sapiens. 
XX 

PN EP875565-A2. 
XX 

PD 04 -NOV- 1998. 
XX 

PF 27-OCT-1997; 97EP-00308554 . 
XX 

PR 30-APR-1997; 97US-00846705 . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 
XX 

PI Bergsma DJ, Ellis C; 
XX 

DR WPI; 1998-570286/49. 
XX 

PT New G-protein coupled receptor HFGAN72Y polypeptide and polynucleotide - 

PT useful as diagnostic reagents and for prevention and treatment of HIV 

PT infections, cancer, osteoporosis and Parkinson's disease. 
XX 

PS Example 1; Page 18-19; 22pp; English. 
XX 

CC This is the nucleotide sequence of the HGS EST 557082 used in the method 

CC of the invention involving the G-protein coupled receptor, HFGAN72Y. Its 

CC polypeptides and polynucleotides are useful for diagnosing susceptibility 

CC to diseases by detecting mutations in the HFGAN72Y gene using probes 

CC containing the HFGAN72Y nucleotide sequence, and can diagnose diseases 

CC associated with HFGAN72Y imbalance by determining HFGAN72Y polypeptide or 

CC mRNA expression levels. Agonists/antagonists can be used in treatment to 

CC activate/inhibit HFGAN72Y activity, in addition to direct administration 

CC of antisense sequences to prevent expression, or HFGAN72Y polypeptides to 

CC treat conditions associated with a lack HFGAN72Y protein. Gene therapy 

CC may also be. used to affect endogenous HFGAN72Y polypeptide production. 

CC HFGAN72Y antibodies are useful for inducing an immune response to 

CC immunise and prevent diseases, and for isolating HFGAN72Y clones or 

CC purifying the polypeptides by affinity chromatography. HFGAN72Y 

CC polypeptides can be administered directly or as a vaccine to inoculate 

CC against diseases. Diseases diagnosed, prevented or treated include HIV-1 

CC or HIV- 2 infections, pain, cancers, anorexia, bulimia, asthma, 

CC Parkinson's disease, acute heart failure, hypotension, hypertension, 

CC urinary retention, osteoporosis-, angina pectoris, myocardial infarction, 

CC ulcers; allergies, benign prostatic hypertrophy, and psychotic and 

CC neurological disorders. The HFGAN72Y polypeptide is also useful for 

CC mapping the gene to a chromosome, allowing gene inheritance to be studied 

CC through linkage analysis. 

XX 

SQ Sequence 1133 BP; 202 A; 366 C; 314 G; 251 T; 0. U; 0 Other; 

Query Match 99.9%; Score 1131.4; DB 2; Length 1133; 
Best Local Similarity 99.9%; Pred. No. 4.5e-263; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

61 TCCCCTGTGCCTC C AGACT AT GAAGAT GAGT TT CT CCGCT AT CT GT GGC GT GAT T AT CT G 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I 
61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCT^AG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I M I I I I I I I I I I I I I I I I I I I I 
541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

601 GT CT GT GAT GAACGCTGGGCAGAT GACCT CTAT CCCAAGAT CTACCACAGTT GCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II I I I I 
601 GT CT GT GAT GAACGCT GGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I | | I 
721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 



Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

Qy 1081 CTCAGTGGATGTAAAGAGAAGAGTCTAGTTCTGTCCTGACCATCGTGCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1081 CT CAGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT C CT GACCAT CGT GCC CC GG 1133 



RESULT 4 
ABA96020 

ID ABA96020 standard; cDNA; 1133 BP. 
XX 

AC ABA96020; 
XX 

DT 12-MAR-2002 (first entry) 
XX 

DE HGS EST 557082. 
XX 

KW G-protein; receptor; HFGAN72Y; cytostatic; cardiant; analgesic; cancer; 

KW nootropic; tranquillising; neuroprotective; anti-asthmatic; gene therapy; 

KW infection; HIV-1; pain; anorexia; bulimia; Parkinson's disease; ulcer; 

KW cardiac disease; urinary retention; asthma; allergy; psychotic disorder; 

KW benign prostatic hypertrophy; neurological disorder; anxiety; delirium; 

KW schizophrenia; manic depression; dementia; mental retardation; EST; 

KW dyskinesia; Huntington's disease; Tourette's syndrome; HIV-2; 

KW HGS EST 557082; expressed sequence tag; ss. 
XX 

OS Homo sapiens . 
XX 

PN EP1156110-A2. 
XX 

PD 21-NOV-2001. 
XX 

PF 27-OCT-1997; 2001EP-00203010 . 
XX 

PR 30-APR-1997; 97US-0084 6705 . 

PR 27-OCT-1997; 97EP-00308554 . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 
XX 

PI Bergsma DJ, Ellis CE; 
XX 

DR WPI; 2002-084320/12. 
XX 

PT New polynucleotide encoding a G-protein coupled receptor designated 

PT HFGAN72Y is useful to diagnose and treat associated diseases including 

PT cancer, infection, cardiac disease and psychotic and neurological 



PT disorders. 
XX 

PS Example 1; Page 18-19; 22pp; English, 
XX 

CC The sequence represents HGS EST 557082. The invention relates to a novel 

CC isolated polynucleotide encoding HFGAN72Y polypeptide. The polypeptide of 

CC the -invention has cytostatic, cardiant, analgesic, tranquillising, 

CC nootropic, neuroprotective, and anti-asthmatic activity. The HFGAN72Y has 

CC a use in gene therapy. The HFGAN72Y polynucleotide or an HFGAN72Y 

CC polypeptide agonist are used to treat a subject in need of enhanced 

CC HFGAN72Y activity or expression. An HFGAN72 Y antagonist or competitor, or 

CC nucleic acid which inhibits HFGAN72Y expression is used to treat a 

CC subject in need of decreased HFGAN72Y activity or expression. HFGAN72Y- 

CC associated diseases include infections, particularly by HIV-1 or HIV-2, 

CC pain, anorexia, bulimia, Parkinson's disease, cardiac diseases, cancers, 

CC ulcers, urinary retention, asthma, allergies, benign prostatic 

CC hypertrophy, and psychotic and neurological disorders including anxiety, 

CC schizophrenia, manic depression, delirium, dementia, severe mental 

CC retardation and dyskinesias such as Huntington f s disease and Tourette's 

CC syndrome 

XX 

SQ Sequence 1133 BP; 202 A; 366 C; 314 G; 251 T; 0 U; 0 Other; 



Query Match 99.9%; Score 1131.4; DB 6; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 4.5e-263; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 


l 


ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 


60 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


i 


ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 


60 


Qy 


61 


TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 


120 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


TCCCCTGTGCCTC CAGACT AT GAAGAT GAGTT T CT C C GCT AT CT GT GG C GT GAT TAT CT G 


120 


Qy 


121 


TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 


180 


Qy 


181 


CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 


240 






1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


CTGGT GGGCAACACGCT GGT C T G C CTGGC C GT GT GGC GGAAC CAC C ACAT GAGGAC AGT C 


240 


Qy 


241 


ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 


300 






1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


ACCAACTACTTCATTGTCAACCTGTCCCTGCCTGACGTTCTGGTGACTGCTATCTGCCTG 


300 


Qy 


301 


CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 


360 






M 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 


360 


Qy 


361 


GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 


420 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


GT CAT CCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTT CATC 


420 


Qy 


421 


GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 


480 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 



421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 8 0 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

601 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CT AC CAC AGT TGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 
I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I j I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT G C GT GC AC GGAG GAAGACAGC CAAGAT GCT G 900 

I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

1081 C T C AGT G GAT GT AAAG AG AAG AGT C T AGT TCTGTCCT GAC CAT CGTGCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 CT CAGT G GAT GTAAAGAGAAGAGT CT AGT T CT GT C CT GAC CAT CGTGCCCCGG 1133 



RESULT 5 
AAV68511 

ID AAV68511 standard; cDNA; 1170 BP. 
XX 

AC AAV68511; 
XX 

DT 29-JAN-1999. (first entry) 
XX 

DE Nucleotide sequence of HFGAN72Y a G-protein coupled receptor. 
XX 



KW G-protein coupled receptor family; HFGAN72Y; mutation; probe; agonist; 

KW antagonist; activation; inhibition; gene therapy; antibody; 

KW immune response; vaccine; HIV-1; HIV-2; cancer; anorexia; bulimia; 

KW asthma; Parkinson's disease; acute heart failure; hypotension; 

KW hypertension; urinary retention; osteoporosis; angina pectoris; 

KW myocardial infarction; ulcer; allergies; psychotic disorder; 

KW neurological disorder; gene mapping; ss. 

XX 

OS Homo sapiens . 
XX 

FH Key Location/Qualif iers 

FT CDS 1. .1170 

FT /*tag= a 

FT /product= "HFGAN72Y protein" 
XX 

PN EP875565-A2. 
XX 

PD 04-NOV-1998. 
XX 

PF 27-OCT-1997; 97EP-00308554 . 
XX 

PR 30-APR-1997; 97US-00846705 . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 
XX 

PI Bergsma DJ, Ellis C; 
XX 

DR WPI; 1998-570286/49. 

DR P-PSDB; AAW80805. 
XX 

PT New G-protein coupled receptor HFGAN72Y polypeptide and polynucleotide - 

PT useful as diagnostic reagents and for prevention and treatment of HIV 

PT infections, cancer, osteoporosis and Parkinson's disease. 
XX 

PS Claim 3; Page 7; 22pp; English. 
XX 

CC This is the nucleotide sequence of the G-protein coupled receptor, 

CC HFGAN72Y used in the method of the invention. HFGAN72Y polypeptides and 

CC polynucleotides are useful for diagnosing susceptibility to diseases by 

CC detecting mutations in the HFGAN72Y gene using probes containing the 

CC HFGAN72Y nucleotide sequence, and can diagnose diseases associated with 

CC HFGAN72Y imbalance by determining HFGAN7 2 Y polypeptide or mRNA expression 

CC levels. Agonists/antagonists can be used in treatment to activate/inhibit 

CC HFGAN72Y activity, in addition to direct administration of antisense 

CC sequences to prevent expression, or HFGAN72Y polypeptides to treat 

CC conditions associated with a lack HFGAN72Y protein. Gene therapy may also 

CC be used to affect endogenous HFGAN72Y polypeptide production. HFGAN72Y 

CC antibodies are useful for inducing an immune response to immunise and 

CC prevent diseases, and for isolating HFGAN72Y clones or purifying the 

CC polypeptides by affinity chromatography. HFGAN72Y polypeptides can be 

CC administered directly or as a vaccine to inoculate against diseases. 

CC Diseases diagnosed, prevented or treated include HIV-1 or HIV-2 

CC infections, pain, cancers, anorexia, bulimia, asthma, Parkinson's 

CC disease, acute heart failure, hypotension, hypertension, urinary 

CC retention, osteoporosis, angina pectoris, myocardial infarction, ulcers; 

CC allergies, benign prostatic hypertrophy, and psychotic and neurological 

CC disorders. The HFGAN72Y polypeptide is also useful for mapping the gene 



CC to a chromosome, allowing gene inheritance to be studied through linkage 

CC analysis 

XX 

SQ Sequence 1170 BP; 208 A; 381 C; 322 G; 259 T; 0 U; 0 Other; 

Query Match 99.6%; Score 1128.2; DB 2; Length 1170; 

Best Local Similarity 99.7%; Pred. No. 2.7e-262; 

Matches 1130; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 
Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 T C C C CT GT GC CT CCAGACT AT GAAGAT GAGTTT CT C C GCT AT CT GT GGC GT GAT TAT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 
Db 61 T C C C CT GT GCCT CCAGACT AT GAAGAT GAGT T T CT C C G CT AT CT GTGGC GT GAT TAT CT G 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACAGGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GT CTGT GATGAACGCT GGGCAGAT GACCTCT ATCC CAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 



Qy 
Db 



721 



721 



780 
780 



Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I 

Db 841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GCAC GGAGGAAGAC AGC CAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CTCAGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT C CT GAC CAT CGTGCCCCGG 1133 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CTCAGTGGATGTAAAGAGAAGAGTCTAGCTCTGTCCTGCCCATCGTGCCCCGG 1133 



RESULT 6 
ABA96019 

ID ABA96019 standard; cDNA; 1170 BP. 
XX 

AC ABA96019; 
XX 

DT 12-MAR-2002 (first entry) 
XX 

DE G-protein coupled receptor (HFGAN72Y) cDNA. 
XX 

KW G-proteiri; receptor; HFGAN72Y; cytostatic; cardiant; analgesic; cancer; 

KW nootropic; tranquillising; neuroprotective; anti-asthmatic; gene therapy; 

KW infection; HIV-1; pain; anorexia; bulimia; Parkinson's disease; ulcer; 

KW cardiac disease; urinary retention; asthma; allergy; psychotic disorder; 

KW benign prostatic hypertrophy; neurological disorder; anxiety; delirium; 

KW schizophrenia; manic depression; dementia; mental retardation; 

KW dyskinesia; Huntiilgton 1 s disease; Tourette ' s syndrome; HIV-2; ss. . : v 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .117 0 

FT /*tag= ' a 

FT /product^ "HGFAN72Y" 

XX 

PN EP1156110-A2. 
XX 

PD 21-NOV-2001. 



XX 

PF 27-OCT-1997; 2001EP-00203010 . 
XX 

PR 30-APR-1997; 97US-0084 6705 . 

PR 27-OCT-1997; 97EP-00308554 . 
XX 

PA (SMIK ) SMITHKLINE BEECRAM CORP. 
XX 

PI Bergsma DJ, Ellis CE; 
XX 

DR WPI; 2002-084320/12. 

DR P-PSDB; ABB08208. 

XX v 

PT New polynucleotide encoding a G-protein coupled receptor designated 

PT HFGAN72Y is useful to diagnose and treat associated diseases including 

PT cancer, infection, cardiac disease and psychotic and neurological 

PT disorders.' 
XX 

PS Claim 3; Page 7; 22pp; English. 
XX 

CC The sequence encodes G-protein coupled receptor HFGAN72Y. The invention 



CC relates to a novel isolated polynucleotide encoding HFGAN72Y polypeptide. 

CC The polypeptide of the invention has cytostatic, cardiant, analgesic, 

CC tranquillising, nootropic, neuroprotective, and anti-asthmatic activity. 

CC The HFGAN72Y has a use in gene therapy. The HFGAN72Y polynucleotide or an 

CC HFGAN72Y polypeptide agonist are used to treat a subject in need of 

CC enhanced HFGAN72Y activity or expression. An HFGAN72Y antagonist or 

CC competitor, or nucleic acid which inhibits HFGAN72Y expression is used to 

CC treat a subject in need of decreased HFGAN72Y activity or expression. 

CC HFGAN72Y-associated diseases include' infections, particularly by HIV-1 or 

CC HIV-2, pain, anorexia, bulimia, Parkinson's disease, cardiac diseases, 

CC cancers, ulcers, urinary retention, asthma, allergies, benign prostatic 

CC hypertrophy, and psychotic and neurological disorders including anxiety, 

CC schizophrenia, manic depression, delirium, dementia, severe mental 

CC retardation and dyskinesias such as Huntington's disease and Tourette's 

CC syndrome 

XX 

SQ Sequence 1170 BP; 208 A; 381 C; 322 G; 259 T; 0 U; 0 Other; 



Query Match 99.6%; Score 1128.2; DB 6; Length 1170; 

Best Local Similarity 99.7%; Pred. No. 2.7e-262; 

Matches 1130; Conservative 0; Mismatches 3; Indels 0; Gaps 0 



Qy 


i 


ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 


60 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


l 


ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 


60 


Qy 


61 


TCCCCTGTGCCTC CAGACTAT GAAGAT GAGT T T CT C CGCT ATCT GT GGC GT GAT TAT CT G 


120 






Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


TCCCCTGTGCCTC CAGACTAT GAAGAT GAGT T T CT C C GCT ATCT GT GGC GT GAT TAT CT G 


120 


Qy 


121 


T AC C CAAAACAGT AT GAGT GGGT CCT CAT C GC AGC CT ATGT GGCT GT GT T C GT C GT GGCC 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 


180 


Qy 


181 


CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 


240 






1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 I | | | | | | M 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I 1 1 1 1 





Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I II I I I I I I I I I I I I I II I I I I I I I 1 1 1 I I I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I 1 1 1 i 1 1 1 

Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I M I I ! I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GT CTGT GAT GAACGCT GGGCAGATGACCT CT AT CCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I II I I I 
Db 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCC7UVGATCTACCACAGTTGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

M I II I I I I I I I I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 81 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I 
Db 841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GCACGGAGGAAGACAGC CAAGAT GCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCC7UVGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 



Qy 1081 CT CAGT GGATGTAAAGAGAAGAGTCTAGTT CT GT C CTGACCAT CGT GCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1081 CTCAGTGGATGTAAAGAGAAGAGTCTAGCTCTGTCCTGCCCATCGTGCCCCGG 1133 



RESULT 7 
AAV63468 

ID AAV63468 standard; cDNA; 1564 BP. 
XX 

AC AAV63468; 
XX 

DT 26-JAN-1999 (first entry) 
XX 

DE cDNA encoding G-protein coupled receptor (HFGAN72X) polypeptide. 
XX 

KW G-protein coupled receptor; HFGAN72X; HIV infection; anorexia; cancer; 

KW bulimia; asthma; Parkinson f s disease; acute heart failure; 

KW urinary retention; osteoporosis; angina pectoris; myocardial infarction; 

KW benign prostatic hypertrophy; neurological disorder; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualif iers 

FT CDS 154. .1431 

FT /*tag= a 

- FT /product= "HFGAN72X" 
XX 

PN EP875566-A2. 
XX 

PD 04-NOV-1998. 
XX 

PF 27-OCT-1997; 97EP-00308563 . 
XX 

PR 30-APR-1997; 97US-0084 67 04 . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 
XX 

PI Bergsma DJ, Ellis CE; 

XX 

DR WPI; 1998-559432/48. 

DR P-PSDB; AAW80456. 
XX 

PT New human G-protein coupled receptor HFGAN72X polypeptide and 

PT polynucleotide - useful as diagnostic reagents and for treating e.g. HIV 

PT infection, cancer and Parkinson's disease. 

XX 

PS Claim 3; Page 7; 24pp; English. 
XX 

CC The present sequence encodes a G-protein coupled receptor (HFGAN72X) 

CC polypeptide. HFGAN72X polypeptides and polynucleotides are useful for 

CC diagnosing diseases related to over or under expression of HFGAN72X 

CC proteins by identifying mutations in the HFGAN72X gene using HFGAN72X 

CC probes, or determining HFGAN72X protein or mRNA expression levels. 

CC HFGAN72X polypeptides are also useful for screening for compounds which 

CC affect activity of the protein. Diseases that can be treated with 

CC HFGAN72X include HIV infections, pain, anorexia, cancers, bulimia, 



CC asthma, Parkinson's disease, acute heart failure, hypotension, 

CC hypertension, urinary retention, osteoporosis, angina pectoris, 

CC myocardial infarction, ulcers, allergies, benign prostatic hypertrophy, 

CC and psychotic and neurological disorders 

XX 

SQ Sequence 1564 BP; 271 A; 511 C; 435 G; 347 T; 0 U; 0 Other; 

Query Match 95.9%; Score 1086.4; DB 2; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 3.6e-252; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 
Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 in i 

Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120. 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 

Qy 121 TACCC7\AAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCT^ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I II 

Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I 

Db 634-s5CCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGct:CCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 GCAGT CAT GGAAT GCAGCAGT GTGCT GCCT GAGCT AGCCAACCGCACACGGCT CTTCT CA 753 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 813 



Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 



Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1,1 I I I I I I I I I I I I I I 

Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCT GGCT GAAGT GAAGCAGAT GC GTG CAC G GAGGAAGACAG CCAAGAT G CT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994. CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GTG CAC G GAG GAAGACAG C CAAGAT G CT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ■ 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCT^ACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 



RESULT 8 
AAV68514 

ID AAV68514 standard; cDNA; 1564 BP. 
XX 

AC AAV68514; 
XX 

DT 29-JAN-1999 (first entry) 
XX 

DE Nucleotide sequence of a probe HGS EST 554692. 
XX 

KW Probe HGS EST 554 692; G-protein coupled receptor family; HFGAN72Y; 

KW mutation; probe; agonist; antagonist; activation; inhibition; 

KW gene therapy; antibody; immune response; vaccine; HIV-1; HIV-2; cancer; 

KW anorexia; bulimia; asthma; Parkinson's disease; acute heart failure; 

KW hypotension; hypertension; urinary i ; etention; osteoporosis; 

KW angina pectoris; myocardial infarction; ulcer; allergies; 

KW psychotic disorder; neurological disorder; gene mapping; ss. 

XX 

OS Synthetic. 

OS Homo sapiens. 
XX 

PN EP875565-A2. 
XX 

PD 04-NOV-1998. 
XX 

PF 27-OCT-1997; 97EP-00308554 . 



XX 

PR 30-APR-1997; 97US-00846705 . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 
XX 

PI Bergsma DJ, Ellis C; 
XX 

DR WPI; 1998-570286/49. 
XX 

PT New G-protein coupled receptor HFGAN72Y polypeptide and polynucleotide - 

PT useful as diagnostic reagents and for prevention and treatment of HIV 

PT infections, cancer, osteoporosis and Parkinson's disease. 
XX 

PS Example 1; Page 19-20; 22pp; English. 
XX 

CC This is the nucleotide sequence of the probe HGS EST 554692 used in the 

CC method of the invention involving the G-protein coupled receptor, 

CC HFGAN72Y. Its polypeptides and polynucleotides are useful for diagnosing 

CC susceptibility to diseases by detecting mutations in the HFGAN72Y gene 

CC using probes containing the HFGAN72Y nucleotide sequence, and can 

CC diagnose diseases associated with HFGAN72Y imbalance by determining 

CC HFGAN72Y polypeptide or mRNA expression levels. Agonists/antagonists can 

CC be used in treatment to activate/inhibit HFGAN72Y activity, in addition 

CC to direct administration of antisense sequences to prevent expression, or 

CC HFGAN72Y polypeptides to treat conditions associated with a lack HFGAN72Y 

CC protein. Gene therapy may also be used to affect endogenous HFGAN72Y 

CC polypeptide production. HFGAN72Y antibodies are useful for inducing an 

CC immune response to immunise and prevent diseases, and for isolating 

CC HFGAN72Y clones or purifying the polypeptides by affinity chromatography. 

CC HFGAN72Y polypeptides can be administered directly or as a vaccine to 

CC inoculate against diseases. Diseases diagnosed, prevented or treated 

CC include HIV-1 or HIV-2 infections, pain, cancers, anorexia, bulimia, 

CC asthma, Parkinson's disease, acute heart failure, hypotension, 

CC hypertension, urinary retention, osteoporosis, angina pectoris, 

CC myocardial infarction, ulcers; allergies, benign prostatic hypertrophy, 

CC and psychotic and neurological disorders. The HFGAN72Y polypeptide is 

CC also useful for mapping the gene to a chromosome, allowing gene 

CC inheritance to be studied through linkage analysis 

XX 

SQ Sequence 1564 BP; 269 A; 508 C; 436 G; 347 T; 0 U; 4 Other; 



Query Match 95.9%; Score 1086.4; DB 2; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 3.6e-252; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy - 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAoAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 T C C C CT GTGC CT C CAGACT AT GAAGAT GAGT TT CT CC GCT AT CT GT GGCGT GAT T AT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 

Qy - .121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 



Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 754 GTCT GT GAT GAAC GCT GG GCAGAT GAC CT CT AT C C CAAGAT CT ACCACAGT T GCT T CTT T 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db' 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 7 81 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 C GC G CCTT CCT G GCT GAAGT GAAGCAGAT GC GT GC ACGGAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I lli i I I i I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GC ACGGAGGAAGACAGC CAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 




Db 



1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 



Qy 



Db 



1081 CTCAGTGG 1088 

I I I I I I I I 
1234 CTCAGTGG 1241 



RESULT 9 
AAF32103 

ID AAF32103 standard; cDNA; 1564 BP. 
XX 

AC AAF32103; 
XX 

DT 10-APR-2001 (first entry) 
XX 

DE Human HFGAN72 receptor coding sequence SEQ ID NO: 12. 
XX 

KW Human; mouse; rat; Lig72A; Lig72B; neuropeptide receptor; HFGAN72; 

KW truncation mutant; ligand; neurodegenerative disorder; pain; 

KW eating disorder; behaviour disorder; mood disorder; ss. 
XX 

OS Homo sapiens . 
XX 

PN WO200100787-A2. 
XX 

PD 04-JAN-2001. 
XX 

PF 22-JUN-2000; 2000WO-US017251 . 
XX 

PR 25-JUN-1999; 99US-0141156P . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 

PA (SMIK ) SMITHKLINE BEECHAM PLC. 
XX 

PI Bingham S, Darker J, Liu W, Martin JD, Parsons AA, Patel SR; 
XX 

DR WPI; 2001-071483/08. 
XX 

PT Polynucleotides encoding Lig 72A polypeptides or their variants , which 

PT are useful in the treatment of a disease or disorder associated with 

PT pain, e.g. enhanced or exaggerated sensitivity to pain, hyperalgesia, 

PT neuropathic pain and back pain. 
XX 

PS Disclosure; Fig 6; lOlpp; English. 

XX ... . ^ v 

CC The present invention provides the protein and coding sequences for the 

CC human, mouse and rat HFGAN receptor ligand Lig72A. It also provides 

CC truncated mutant versions. These, and their agonists and antagonists, are 

CC all useful in the treatment of eating, neurodegenerative, behaviour, 

CC mood, sexual, hormonal and sleep disorders, pain, depression, epilepsy 

CC and acute inflammatory conditions 

XX 

SQ Sequence 1564 BP; 271 A; 511 C; 435 G; 347 T; 0 U; 0 Other; 



Query Match 95.9%; Score 1086.4; DB 4; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 3.6e-252; 



Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I II II I I I I I I I I I I I I I I I I I I I 

Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTC C AG ACT AT GAAGAT GAGT T T CT C C GCT AT CT GT GG C GT GAT TAT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTT^CTCTCAGCTTCATC 57 3 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCAT GGAAT GCAGCAGT GTGCT GCCTGAGCT AGCCAACCGCACACGGCT CTT CT CA 600 

i i i i i i i i i i i i i i i i i-i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

Db 694 GCAGTCAT GGAAT GCAGCAGT GTGCT GCCTGAGCTAGCCAACCGCACACGGCT CTT CTCA 753 

Qy 601 GT CT GT GAT GAAC GCT GGGC AGAT GAC CT CT AT C C CAAGAT CTAC CACAGT T GCTT CT T T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 GT CT GT GAT GAAC GCT GGGC AGAT GAC CT CT AT C C CAAGAT CTAC CACAGT T GCTT CT T T 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 7 81 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 



Qy 

Db 



841 
994 



900 



1053 



Qy 



Db 



901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 



961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGGGAAGCTGTCTACGCCTGCTTC 102 0 




Db 



1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 



Qy 



Db 



1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 



Qy 



1081 CTCAGTGG 1088 



Db 



1234 CTCAGTGG 1241 



RESULT 10 




ABA96021 




ID 


ABA96021 standard; cDNA; 1564 BP. 




XX 






AC 


ABA96021; 




XX 






DT 


12-MAR-2002 (first entry) 




XX 






DE 


HGS EST 554692. 




XX 






KW 


G-protein; receptor; HFGAN72Y; cytostatic; 


cardiant; analgesic; cancer; 


KW 


nootropic; tranquillising; neuroprotective; 


anti-asthmatic; gene therapy; 


KW 


infection; HIV-1; pain; anorexia; bulimia; 


Parkinson's disease; ulcer; 


KW 


cardiac disease; urinary retention; asthma; 


allergy; psychotic disorder; 


KW 


benign prostatic hypertrophy; neurological 


disorder; anxiety; delirium; 


KW 


schizophrenia; manic depression; dementia; 


mental retardation; EST; 


KW 


dyskinesia; Huntington's disease; Tourette 1 


s syndrome; HIV-2; 


KW 


HGS EST 554692; expressed sequence tag; probe; ss. 


XX 






OS 


Homo sapiens. 




XX 






PN 


EP1156110-A2. 




XX 






PD 


21 -NOV- 2001. 




XX 






PF 


27-OCT-1997; 2001EP-00203010 . 




XX 






PR 


30-APR-1997; 97US-00846705 . 




PR 


27-OCT-1997; 97EP-00308554 . 




XX 






PA 


(SMIK ) SMITHKLINE BEECHAM CORP. 




XX 






PI 


Bergsma DJ, Ellis CE; 




XX 






DR 


WPI; 2002-084320/12. 





XX 

PT New polynucleotide encoding a G-protein coupled receptor designated 

PT HFGAN72Y is useful to diagnose and treat associated diseases including 

PT cancer, infection, cardiac disease and psychotic and neurological 

PT disorders. 
XX 

PS Example 1; Page 19-20; 22pp; English. 
XX 

CC The sequence represents HGS EST 554692. The sequence was used in the 

CC invention as a probe to screen a human genomic placenta phage library. 

CC The invention relates to a novel isolated polynucleotide encoding 

CC HFGAN72Y polypeptide. The polypeptide of the invention has cytostatic, 

CC cardiant, analgesic, tranquillising, nootropic, neuroprotective, and anti 

CC -asthmatic activity. The HFGAN72Y has a use in gene therapy. The HFGAN72Y 

CC polynucleotide or an HFGAN72Y polypeptide agonist are used to treat a 

CC subject in need of enhanced HFGAN72Y activity or expression. An HFGAN72Y 

CC antagonist or competitor, or nucleic acid which inhibits HFGAN72Y 

CC expression is used to treat a subject in need of decreased HFGAN72Y 

CC activity or expression. HFGAN72Y-associated diseases include infections, 

CC particularly by HIV-1 or HIV-2, pain, anorexia, bulimia, Parkinson's 

CC disease, cardiac diseases, cancers, ulcers, urinary retention, asthma, 

CC allergies, benign prostatic hypertrophy, and psychotic and neurological 

CC disorders including anxiety, schizophrenia, manic depression, delirium, 

CC dementia, severe mental retardation and dyskinesias such as Huntington's 

CC disease and Tourette f s syndrome 

XX 

SQ Sequence 1564 BP; 269 A; 508 C; 436 G; 347 T; 0 U; 4 Other; 

Query Match 95.9%; Score 1086.4; DB 6; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 3.6e-252; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 
Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 




Db 



154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 



Qy 



61 T C CCCT GT GC CT C CAGACT AT GAAGAT GAGT T T CT C C GCT AT CTGT GGCGT GATT AT CT G 12 0 




Db 



214 TCCCCTGTGCCT CCAGACT AT GAAGAT GAGT T T CT C C GCT AT CT GT GGCGT GATT AT CT G 273 



QY 



121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 




Db 



274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 



Qy 



Db 



181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mil I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 



Qy 



241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 




Db 



394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 



Qy 



301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 




Db 



454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 



Qy 



361 



GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 



420 



I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I 

Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 . 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I! I I I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GT CT GT GAT GAAC GCT G GGCAGAT GAC CT CT AT CCCAAGAT CT ACC AC AGT T GCTT CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 87 3 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 994 CGCGCCTTCCT G GCT GAAGT GAAGC AGAT GC GT GCAC GGAGGAAGACAGC CAAGAT GCTG 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I 

Db"--" 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy - 1081 CTCAGTGG 1088 

I I I I I I I I 

Db 1234 CTCAGTGG 1241 



RESULT 11 
AAI64173 

ID AAI64173 standard; cDNA; 1564 BP. 
XX 

AC AAI64173; 



XX 

DT 22-JAN-2002 (first entry) ... 
XX 

DE HFGAN72X G coupled receptor polypeptide partial sequence. 
XX 

KW Antibacterial; fungicide; virucide; protozoacide; anti-HIV; analgesic; 

KW cytostatic; nootropic; antiparkinsonian; cardiant; antiulcer; 

KW antiasthmatic; tranquiliser ; neuroleptic; antidepressant; anticonvulsant 

KW osteopathic; HIV infection; pain; cancer; anorexia; bulimia; 

KW Parkinson's disease; ' acute heart failure; hypotension; hypertension; 

KW urinary retention; osteoporosis; angina pectoris; probe; 

KW myocardial infarction; ulcers; asthma; allergy; delirium; dementia; 

KW benign prostatic hypertrophy; anxiety; schizophrenia; manic depression; 

KW dyskinesia; G coupled receptor; HFGAN72X; 1 transmembrane receptor; ss. 

XX 

OS Homo sapiens. 



XX 

FH Key Location/Qualifiers 

FT CDS 154. .1362 

FT /*tag= a 

FT /partial 

FT /product^ "HFGAN72X protein" 

FT /note= "The specification states that this is a partial 

FT sequence even though it contains start and stop codons; 

FT HFGAN72X is a G coupled receptor polypeptide" 

FT /transl_except= (pos:991. .993, aa:Ala) 

XX 



PN EP1154019-A2. 
XX 

PD 14-NOV-2001. 
XX 

PF 27-OCT-1997; 2001EP-00203008 . 
XX 

PR 30-APR-1997; 97US-00846704 . 

PR 27-OCT-1997; 97EP-00308563 . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 
XX 

PI Bergsma DJ, Ellis CE; 
XX 

DR WPI; 2002-012659/02. 

DR P-PSDB; AAG78346. 
XX 

PT Nucleic acid encoding the HFGAN72X receptor, useful for diagnosis and 

PT treatment of e.g. infections, cancer, anorexia, bulimia, Parkinson's 

PT disease, and acute aeart failure. . 
XX 

PS Example 3; Page 9; 24pp; English. 
XX 

CC The present sequence is that of a known partial nucleotide sequence 

CC encoding a HFGAN72X polypeptide (AAG7834 6) used as a probe to identify 

CC the HFGAN72X gene (AAI64173) . The specification describes a newly 

CC isolated polynucleotide encoding a human HFGAN72X G coupled receptor 

CC polypeptide. The protein of the invention has antibacterial, fungicide, 

CC virucide, protozoacide, anti-HIV, cardiant, analgesic, cytostatic, 

CC nootropic, antiparkinsonian, antiulcer, antiasthmatic, tranquiliser, 

CC neuroleptic, antidepressant, anticonvulsant and osteopathic activities. 



CC HFGAN72X polynucleotides (PNs) are used to express HFGAN72X in vivo, to 

CC treat diseases requiring increased activity or expression of HFGAN72X; 

CC for recombinant production of HFGAN72X; diagnose diseases by detecting 

CC mutations in genomic sequences and in chromosome identification and 

CC mapping. HFGAN72X polypeptides are used to raise specific antibodies; as 

CC therapeutic agents; to identify HFGAN72X protein-expressing clones; to 

CC purify HFGAN72X proteins; in vaccines. Cells transformed with HFGAN72X 

CC PNs are used to identify (ant ) agonists of HFGAN72X, useful 

CC therapeutically. Nucleic acids that inhibit expression of HFGAN72X and 

CC polypeptides that compete with ligands for binding to HFGAN72X proteins 

CC are also useful therapeutically and diagnostically . HFGAN72X-related 

CC diseases include infections (bacterial, viral, fungal or protozoal, 

CC particularly HIV-1 or -2); pain; cancer; anorexia; bulimia; Parkinson's 

CC disease; acute heart failure; hypotension; hypertension; urinary 

CC retention; osteoporosis; angina pectoris; myocardial infarction; ulcers; 

CC asthma; allergy; benign prostatic hypertrophy; anxiety; schizophrenia; 

CC manic depression; delirium; dementia; severe mental retardation and 

CC dyskinesias 

XX 

SQ Sequence 1564 BP; 269 A; 508 C; 436 G; 347 T; 0 U; 4 Other; 

Query Match 95.9%; Score 1086.4; DB 6; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 3.6e-252; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 



Db 



I I I I I I I I I I I I II ! I I I I I I I I I I I I I I I I I II I I I I I I I I I II II I I I I I I I I I I I I I 

214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 



Qy 



121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 




Db 



274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 



Qy 



Db 



181 CT GGT GGGCAACACGCT GGT CT GCCT GGC CGT GT GGCGGAACCACCACAT GAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 



Qy 



Db 



241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 



Qy 



Db 



301 CCGGCCAGCCTGCTGGTGGACATCACTGAoTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 



Qy 



Db 



361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
514 GT CAT CCCCTAT CT ACAGGCT GT GT CCGT GT CAGT GGCAGT GCTAACT CT CAGCTTCATC 573 



Qy 

Db 



421 
574 



480 
633 



Qy 4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II- 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 GCAGT CAT G GAATGC AGCAGT GT GCT GCCTGAGCT AGC CAAC C GCACAC G GCT CT T CT C A 753 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 754 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GC AC GGAGGAAGAC AG C C AAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 994 CGC G C CTT C CT GGCT GAAGT GAAGCAGAT GC GT GCAC GGAGGAAGACAGC CAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 



RESULT 12 -r*- _ 
AAI64172 

ID AAI64172 standard; cDNA; 1564 BP. 
XX 

AC AAI64172; 
XX 

DT 22-JAN-2002 (first entry) 
XX 

DE Human HFGAN72X G coupled receptor polypeptide cDNA. 
XX 

KW Antibacterial; fungicide; virucide; protozoacide; anti-HIV; analgesic; 
KW cytostatic; nootropic; antiparkinsonian; cardiant; antiulcer; 



KW antiasthmatic; tranquiliser ; neuroleptic; antidepressant; anticonvulsant; 

KW osteopathic; HIV infection; pain; cancer; anorexia; bulimia; 

KW Parkinson's disease; acute heart failure; hypotension; hypertension; 

KW urinary retention; osteoporosis; angina pectoris; myocardial infarction; 

KW ulcers; asthma; allergy; delirium; dementia; 

KW benign prostatic hypertrophy; anxiety; schizophrenia; manic depression; 

KW dyskinesia; G coupled receptor; HFGAN72X; 7 transmembrane receptor; ss. 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 154. .1431 

FT /*tag= a 

FT /product- "HFGAN72X protein" 

FT /note= "G coupled receptor polypeptide" 

XX 

PN EP1154019-A2. 
XX 

PD 14-NOV-2001. 
XX 

PF 27-OCT-1997; 2 001EP-00203008 . 
XX 

PR 30-APR-1997; 97US-00846704 . 

PR 27-OCT-1997; 97EP-00308563 . 
XX 

PA (SMIK ) SMITHKLINE BEECHAM CORP. 
XX 

PI Bergsma DJ, Ellis CE; 
XX 

DR WPI; 2002-012659/02. 

DR P-PSDB; AAG78345. 
XX 

PT Nucleic acid encoding the HFGAN72X receptor, useful for diagnosis and 

PT treatment of e.g. infections, cancer, anorexia, bulimia, Parkinson's 

PT disease, and acute heart failure. 
XX 

PS Claim 3; Page 7; 24pp; English. 
XX 

CC The present sequence is that of a cDNA encoding a HFGAN72X polypeptide 
CC ■ (AAG78345) . The specification describes a newly isolated polynucleotide 

CC encoding a HFGAN72X G coupled receptor polypeptide. The protein of the 

CC invention has antibacterial, fungicide, virucide, protozoacide, anti-HIV, 

CC cardiant, analgesic, cytostatic, nootropic, antiparkinsonian, antiulcer, 

CC antiasthmatic, tranquiliser, neuroleptic, antidepressant, anticonvulsant 

CC and osteopathic activities. HFGAN72X polynucleotides (PNs) are used to 

CC express HFGAN72X in vivo, to creat diseases requiring increased activity 

CC or expression of HFGAN72X; for recombinant production of HFGAN72X; 

CC diagnose diseases (or susceptibility to them) by detecting mutations in 

CC genomic sequences and in chromosome identification and mapping. HFGAN72X 

CC polypeptides are used to raise specific antibodies; as therapeutic agents 

CC ; to identify HFGAN72X protein-expressing clones; to purify HFGAM72X 

CC proteins; in vaccines. Cells transformed with HFGAN72X PNs are used to 

CC identify (ant ) agonists of HFGAN72X, useful therapeutically. Nucleic acids 

CC that inhibit expression of HFGAN72X and polypeptides that compete with 

CC ligands for binding to HFGAN72X proteins are also useful therapeutically 

CC and diagnostically . HFGAN72X-related diseases include infections 

CC (bacterial, viral, fungal or protozoal, particularly HIV-1 or -2) ; pain; 



CC cancer; anorexia; bulimia; Parkinson's disease; acute heart failure; 

CC hypotension; hypertension; urinary retention; osteoporosis; angina 

CC pectoris; myocardial infarction; ulcers; asthma; allergy; benign 

CC prostatic hypertrophy; anxiety; schizophrenia; manic depression; delirium 

CC ; dementia; severe mental retardation and dyskinesias 

XX 

SQ Sequence 1564 BP; 271 A; 511 C; 435 G; 347 T; 0 U; 0 Other; 

Query Match 95.9%; Score 1086.4; DB 6; Length 1564; 

Best Local Similarity 99.9%'; Pred. No. 3.6e-252; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I i I I | I I I I I I I I I II I I I I I I I 
Db 154 ATGGAGCC CT CAGC C AC CC C AGGGG C C CAGAT GGGGGT C CC C C CT GGCAGCAGAGAGC C G 213 

Qy 61 TCC C CT GT GC CTCCAGACTAT GAAGAT GAGT T T CT C CGCT AT CT GT GGC GT GAT T AT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 TCC C CT GT GC CT CCAGACTAT GAAGAT GAGT T T CT CC GCTAT CT GT GGC GT GATT AT CT G 273 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ill I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GT CT GT GAT GAACG CT GGGC AGAT GAC CT CT AT C CCAAGAT CT AC CACAGT TGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 GT CT GT GAT GAAC G CT GGGCAGAT GAC CT CT AT C CCAAGAT CT AC CACAGT TGCTTCTTT 813 



Qy 



661 



ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 814 ATT GT CACCT AC CT GGC C C CACT GGGC CT CAT GGCCAT GGC CTAT T T C CAGAT AT TCC G C 87 3 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I II I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 994 CGCGC CTTCCT GGCTGAAGTGAAGCAGAT GC GT GCACGGAGGAAGACAGCCAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 AC CT T CT C C CACT GGCT G GT GT AC GC C AACAGC GCT GC CAAC C C CAT CAT CT AC AACT T C 1080 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 

Db 1234 CTCAGTGG 1241 



RESULT 13 
ABZ42789 

ID ABZ42789 standard; DNA; 1564 BP. 
XX 

AC ABZ42789; 
XX 

DT 04-MAR-2003 (first entry) 
XX 

DE Human orexin receptor 1 nucleotide SEQ ID NO: 367. 
XX 

KW G protein-coupled receptor; GPCR; antigenic peptide; gene therapy; 

KW G protein-coupled receptor modulator; antibody; immune- related disease; 

KW growth-related disease; cell regeneration-related disease; AIDS; cancer; 

KW immunological-related cell, proliferative disease; autoimmune disease; 

KW Alzheimer 1 s disease; atherosclerosis; infection; osteoarthritis; allergy; 

KW osteoporosis; cardiomyopathy; inflammation; Crohn's disease; diabetes; 

KW graft versus host disease; Parkinson 1 s disease; multiple sclerosis; pain; 

KW psoriasis; anxiety; depression; schizophrenia; dementia; memory loss; 

KW mental retardation; epilepsy; asthma; tuberculosis; obesity; nausea; 

KW hypertension; hypotension; renal disorder; rheumatoid arthritis; trauma; 

KW ulcer; gene; ds . 

XX 

OS Homo sapiens. 
XX 

PN WO200261087-A2. 



PD 08-AUG-2002. 
XX 

PF 19-DEC-2001; 2001WO-US050107 . 
XX 

PR 19-DEC-2000; 2000US-0257144P . 
XX 

PA (LIFE- ) LIFESPAN BIOSCIENCES INC. 
XX 

PI Burmer GC, Roush CL, Brown JP; 
XX 

DR WPI; 2003-046718/04. 

DR P-PSDB; ABP81941. 
XX 

PT New isolated antigenic peptides e.g., for G protein-coupled receptors 

PT (GPCR), useful for diagnosing and designing drugs for treating conditions 

PT in which GPCRs are involved, e.g. AIDS, Alzheimer's disease, cancer or 

PT autoimmune diseases . 

XX 

PS Disclosure; Fig 1; 523pp; English. 
XX 

CC The present invention describes antigenic peptides (I) comprising: (a) 

CC any one of 1601 sequences (see ABP82019 to ABP83619) of 12-24 amino 

CC acids. Also described: (1) an assay for the detection of a particular G 

CC protein-coupled receptor (GPCR) or a candidate polypeptide in a sample; 

CC and (2) an isolated antibody having high specificity and high affinity or 

CC avidity for a particular GPCR. (I) can be used as GPCR modulators and in 

CC gene therapy. The antigenic peptides for GPCRs are useful in detecting an 

CC antibody against a particular GPCR, and in the production of specific 

CC antibodies. The peptides and antibodies are also useful for detecting the 

CC presence or absence of corresponding GPCRs. The antigenic peptides for 

CC GPCRs and antibodies are useful for diagnosing and designing drugs for 

CC treating immune- related diseases, growth-related diseases, cell 

CC regeneration-related disease, immunological-related cell proliferative 

CC diseases, or autoimmune diseases, e.g. AIDS, Alzheimer ! s disease, 

CC atherosclerosis, bacterial, fungal, protozoan or viral infections, 

CC osteoarthritis, osteoporosis, cancer, cardiomyopathy, chronic and acute 

CC inflammation, allergies, Crohn 1 s disease, diabetes, graft versus host 

CC disease, Parkinson's disease, multiple sclerosis, pain, psoriasis, 

CC anxiety, depression, schizophrenia, dementia, mental retardation, memory 

CC loss, epilepsy, asthma, tuberculosis, obesity, nausea, hypertension, 

CC hypotension, renal disorders, rheumatoid arthritis, trauma, ulcers, or 

CC any other disorder in which GPCRs are involved. The antibodies may be 

CC used in immunoassays and immunodiagnosis . ABZ42523 to ABZ42869 encode 

CC GPCR proteins given in ABP81675 to ABP82018, which are used in the 

CC :> exemplification of the present invention " : 

XX 

SQ Sequence 1564 BP; 268 A; 513 C; 436 G; 347 T; 0 U; 0 Other; 

Query Match 95.9%; Score 1086.4; DB 7; Length 1564; 
Best Local Similarity 99.9%; Pred. No. 3.6e-252; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 AT GGAGC C C T C AGC CACC C C AGGG GC CC AGAT GGGGGTCCCCC CTGG C AG CAGAGAGCC G 213 



Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 T C C C CT GTGCCT C C AGAC TAT GAAGAT GAGTTT CTC C G CT AT CT GT GGC GT GAT TAT CT G 27 3 

Qy -121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I 

Db 27 4 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 4 53 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db * 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GT CT GT GAT GAACGCT GGGCAGAT GAC CT CT ATCC CAAGAT CTACCACAGT T GCT T CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 754 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 87 3 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I U i?l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M l I I I I I I I I I I I h i 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 7 81 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 

Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCT GGCT GAAGT GAAGC AGAT GC GTGCACGGAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994 C GC GC CT T CCT GGCT GAAGT GAAGCAGAT GC GT GCAC GGAGGAAGACAGC CAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 



Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I II 
Db 1234 CTCAGTGG 1241 



RESULT 14 
AAT42827 

ID AAT42827 standard; cDNA; 1110 BP. 
XX 

AC AAT42827; 
XX 

DT 22-FEB-1997 (first entry) 
XX 

DE Neuropeptide receptor splice variant-1 gene. 
XX 

KW Human; neuropeptide receptor; splice variant; drug screening; 

KW receptor-agonist; receptor-antagonist ; anorectic; antitumour; 

KW anticholesterolemic; neuroprotective; anticonvulsant; hypotensive; 

KW sedative; diagnostic; gene therapy; ss. 

XX 

OS Homo sapiens. 
XX 

PN W09634877-A1. 
XX 

PD 07-NOV-1996. 
XX 

PF 05-MAY-1995; 95WO-US005616 . 
XX 

PR 05-MAY-1995; 95WO-US005616 . 
XX 

PA (HUMA-) HUMAN GENOME SCI INC. 
XX 

PI Soppet DR, Li Y, Rosen CA; 
XX 

DR WPI; 1996-506094/50. 

DR P-PSDB; AAW06125. 
XX 

PT Human neuro-peptide receptor polypeptide ( s ) - used to identify 

PT antagonists and agonists to such polypeptide (s ) , e.g. in the treatment of 

PT obesity, Alzheimer's disease, epilepsy, etc. 

XX 

PS Disclosure; Page 50-51; 77pp; English. 
XX 

CC The sequence encodes human neuropeptide receptor splice variant-1, which 

CC retains activity corresponding to the mature receptor (encoded by 

CC AAT42826) . The receptor gene has been isolated from from a human adult 



CC hypothalamus cDNA library, and is structurally related to the G-protein- 

CC coupled receptor family. The receptor may be used in a drug screening ., 

CC assay for isolation of receptor-agonists and -antagonists, which may be 

CC used as anorectic, antitumour, anticholesterolemic, neuroprotective, 

CC anticonvulsant, hypotensive or sedative drugs, etc. The DNA may also be 

CC used in genetic disease diagnosis or gene therapy. The receptor and its 

CC corresponding antibody may also be used in therapy and diagnosis 
XX 

SQ Sequence 1110 BP; 194 A; 364 C; 305 G; 247 T; 0 U; 0 Other; 



Query Match 95.7%; Score 1084.8; DB 2; Length 1110; 

Best Local Similarity 99.8%; Pred. No. 7.9e-252; 

Matches 1086; Conservative 0; Mismatches 2; Indels 0; Gaps 0 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 12 0 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 2.40 

I I I I I I I I I I I I LI I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy. 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

I I I I I I I I I I I I I I I I I I f I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 48 0 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | 
Db ( 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GTCTGT GAT GAACGCT GGGCAGATGACCT CTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MINIMI 

Db 601 GTCTGT GAT GAACGCT GGGCAGAT GACCT CTATCCCAAGATCTACCACAGTT GCTT CTTT 660 



Qy 661 ATTGTCACCTACCTGGCCCCACTGGGGCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I LI I I I I I I I I I I I I 

Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GC ACG GAGGAAGACAGC CAAGAT GCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTCCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCC7\ACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1081 CTCAGTGG 1088 



RESULT 15 
AAS00491 



ID AAS00491 standard; cDNA; 1278 BP. 
XX 

AC AAS00491; 
XX 

DT 17-MAY-2001 (first entry) 
XX 

DE Human neuropeptide receptor cDNA. 
XX 

KW Human; neuropeptide receptor; neuropeptide Y receptor; obesity; 

KW nervous system disorder; hyperprolif erative disorder; diabetes mellitus; 

KW cardiovascular disorder; autoimmune disorder; infectious disorder; 

KW eating behaviour disorder; narcolepsy; neurological disease; 

KW narcotics addiction; nicotine addiction; alcohol addiction; gene therapy; 

KW protein co-ordinate data; chromosome 1; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .1278 

FT /*tag= a 

FT /product^ "neuropeptide receptor" 



XX 

PN WO200117532-A1. 
XX 

PD 15-MAR-2001. 
XX 

PF 07-SEP-2000; 2000WO-US024518 . 
XX 

PR 10-SEP-1999; 99US-00393696 . 
XX 

PA (HUMA-) HUMAN GENOME SCI INC. 
XX 

PI Soppet DR, Li Y, Rosen CA; 
XX 

DR WPI; 2001-183276/18. 

DR P-PSDB; AAU00438. 
XX 

PT A new nucleic acid encoding a human neuropeptide receptor polypeptide, 

PT useful for preventing, treating or ameliorating obesity, narcolepsy, 

PT neurological disease and addiction to narcotics, nicotine and alcohol. 
XX 

PS Claim 4; Fig 1; 385pp; English. 
XX 

CC The present sequence encodes for a novel human neuropeptide receptor 

CC which shows sequence homology to the neuropeptide Y receptor. Two splice 

CC variants of the neuropeptide receptor (AAU00439-AAU00440 ) and a possible 

CC mutant (AAU00442) are also described. Polypeptides and polynucleotides of 

CC the neuropeptide receptor are useful for diagnosing, preventing, or 

CC treating a pathological condition in a subject related to the central 

CC nervous and peripheral nervous systems (CNS and PNS) . The polypeptides 

CC and polynucleotides may be used to treat hyperprolif erative, 

CC cardiovascular, autoimmune, nervous system or infectious disorders e.g. 

CC cancer, heart disease, rheumatoid arthritis, Alzheimer f s disease, HIV 

CC infection and diabetes mellitus. In particular they are useful for 

CC preventing, treating or ameliorating a medical condition in a mammal such 

CC as obesity/eating behaviour disorders, narcolepsy, neurological disease, 

CC addiction to narcotics, nicotine and alcohol, chronic pain, acute pain, 

CC migraine headaches and anxiety disorders. The polynucleotides encoding 

CC the neuropeptide receptor can also be used in gene therapy methods for 

CC treating such diseases 

XX 

SQ Sequence 1278 BP; 220 A; 426 C; 347 G; 285 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1084.8; DB 4; Length 1278; 
Best Local Similarity 99.8%; Pred. No. 8.2e-252; 

Matches 1086; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 



Qy 

Db 



121 
121 



TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 



181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I ! I I I I I I I I I I I I 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I ! I I I I I I I I I I II 1 I I I I I I I I I I II I 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

601 GTCT GT GAT GAAC G CT GGGCAGAT GAC CT CT AT C C CAAGAT CT AC C ACAGT TGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I 

601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGCC 84 0 

841 CGCGCGTT CCT GGCT GAAGT GAAGCAGAT GCGT GCACGGAGGAAGACAGCCAAGAT&CT G 900 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I 

841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GCGT GCACGGAGGAAGACAGCCAAGAT GCT G 900 

901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 102 0 



Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1081 CTCAGTGG 1088 



Search completed: October 15, 2004, 16:01:47 
Job time : 485.963 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



October 15, 2004, 15:25:17 ; Search time 88.8123 Seconds 

(without alignments) 
7079.645 Million cell updates/sec 

US-10-070-532-5 
1133 

1 atggagccctcagccacccc tcctgaccatcgtgccccgg 1133 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 682709 seqs, 277475446 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



1365418 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : Issued_Patents_NA: * 

1: /cgn2_6/ptodata/2/ina/5A_COMB.seq: * 

2 : /cgn2_6/ptodata/2/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/2/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/2/ina/6B_COMB. seq: * 

5: /cgn2_6/ptodata/2/ina/PCTUS_COMB.seq: * 

6: / cgn2_6/ptodata/2/ina/backf ilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a ' 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
US-08-846-705-3 

; Sequence 3, Application US/08846705 

; Patent No. 5935814 

; GENERAL INFORMATION: 

APPLICANT : BERGSMA, DERK J. 

APPLICANT: ELLIS, CATHERINE E 

TITLE OF INVENTION: NOVEL G-PROTEIN COUPLED 
NUMBER OF SEQUENCES : 5 
CORRESPONDENCE ADDRESS: 

ADDRESSEE : RATNER & PRESTIA 

STREET: P.O. BOX 980 

CITY: VALLEY FORGE 

STATE: PA 

COUNTRY: USA 

ZIP: 19482 
COMPUTER READABLE FORM: 



MEDIUM TYPE: Diskette 
COMPUTER: IBM Compatible 
OPERATING SYSTEM: DOS 

SOFTWARE: FastSEQ for Windows Version 2.0 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/846,705 
FILING DATE: 30-APR-1997 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 
APPLICATION NUMBER: 
FILING DATE: 
ATTORNEY/AGENT INFORMATION: 
NAME: PRESTIA, PAUL F 
REGISTRATION NUMBER: 23,031 
REFERENCE/ DOCKET NUMBER: GH-70003 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 610-407-0700 
TELEFAX: 610-4 07-0701 
TELEX: 846169 
INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1133 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-846-705-3 

Query Match 99.9%; Score 1131.4; DB 2; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 9.6e-261; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTC CAGACT AT GAAGAT GAGT TT CT C C GCT AT C T GT G GC GT GAT TAT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 T C C CCT GT GC CTC CAGACTAT GAAGAT GAGT TT CT C C GCT AT CT GT GGCGT GAT TAT CT G 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 h 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 it 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I 

Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCT GCT GGTGGACATCACT GAGT CCT GGCTGTTCGGCCATGCCCTCTGCAAG 360 



Qy 



361 



GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 



420 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 



Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GT CTGT GATGAACGCT GGGCAGAT GACCT CTAT C CCAAGAT CTACCACAGTT GCTT CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 C GCGC CTT CCT GGCT GAAGT GAAGCAGAT GC GT GCAC G GAGGAAGAC AGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCTG GCT GAAGT GAAGCAGAT GC GT GCAC GGAGGAAGACAGC CAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1030 

Qy 1081 CT CAGT GGAT GT AAAGAGAAGAGT C T AGT T CT GT C CT GAC CAT CGT GC C C C GG 1133 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 CT CAGT GGAT GT AAAGAGAAGAGT CT AGT T CT GT CCT GAC CAT CGTGCCCCGG 1133 



RESULT 2 

PCT-US95-05616-5 

Sequence 5, Application PC/TUS9505616 
GENERAL INFORMATION: 

APPLICANT: LI, ET AL. 



TITLE OF INVENTION: Human Neuropeptide Receptor 
NUMBER OF SEQUENCES: 12 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: CARELLA, BYRNE, BAIN, GILFILLAN, 
ADDRESSEE: CECCHI, STEWART & OLSTEIN 
STREET: 6 BECKER FARM ROAD 
CITY: ROSELAND 
STATE: NEW JERSEY 
COUNTRY: USA 
ZIP: 07068 
COMPUTER READABLE FORM: 

MEDIUM TYPE: 3.5 INCH DISKETTE 
COMPUTER: IBM PS/2 
OPERATING SYSTEM: MS-DOS 
SOFTWARE : WORD PERFECT 5.1 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US95/05616 
FILING DATE: concurrently 
CLASSIFICATION: 
ATTORNEY/AGENT INFORMATION: 
NAME: FERRARO, GREGORY D. 
REGISTRATION NUMBER: 36,134 
REFERENCE/DOCKET NUMBER: 325800-268 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 201-994-1700 
TELEFAX: 201-994-1744 
INFORMATION FOR SEQ ID NO: 5: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1133 BASE PAIRS 
TYPE: NUCLEIC ACID 
STRANDEDNESS : SINGLE 
TOPOLOGY: LINEAR 
MOLECULE TYPE: cDNA 
PCT-US95-05616-5 

Query Match 99.9%; Score 1131.4; DB 5; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 9.6e-261; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I Ml 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGACCCC 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
-Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 



Qy 



241 



ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 
I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



300 



Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 



Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I 

Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GC C CT GGACCGCTGGTAT GC.C AT CT GC CAC C CACT AT T GT T CAAGAGCAC AGCC C GG C GG 480 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GC AGT C AT GGAAT GCAGCAGT GTGCTGCCT GAG CT AGC CAAC C GC ACACGGCT CTT CT CA 600 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GCAGT CAT GGAAT GCAGCAGT GT GC T GC CT GAGCT AGC CAAC CGCACACGGCTCTTCTCA 600 

Qy 601 GT CT GTGAT GAACGCTGGGCAGAT GACCT CTAT CCCAAGAT CTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GT CTGTGAT GAACGCTGGGCAGAT GAC CTCTAT CCCAAGATCTACCACAGTTGCTT CTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 7 81 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCT GGCTGAAGT GAAGCAGAT GC GT GC AC GGAGGAAGACAGCCAAGATGCT G 900 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 841 CGCGCCTTCCT G GCT GAAGT GAAGCAGAT G C GT GC AC GGAGGAAGACAGCCAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 C T C AGT GGAT GT AAAGAGAAGAGT CT AGTT CT GT C CT GAC C AT CGT GCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1081 C T C AGT GGAT GT AAAGAGAAGAGT CT AGTT CT GT C CT GAC CAT CGT GCCCCGG 1133 



RESULT 3 
US-08-846-705-1 

; Sequence 1, Application US/08846705 
; Patent No. 5935814 
; GENERAL INFORMATION: 

APPLICANT: BERGSMA, DERK J. 

APPLICANT: ELLIS, CATHERINE E 

TITLE OF INVENTION: NOVEL G-PROTEIN COUPLED 
NUMBER OF SEQUENCES: 5 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: RATNER & PRESTIA 
STREET: P.O. BOX 980 
; CITY: VALLEY FORGE 

; STATE: PA 

; COUNTRY: USA 

ZIP: 19482 
COMPUTER READABLE FORM: 
MEDIUM TYPE: Diskette 
COMPUTER: IBM Compatible 
OPERATING SYSTEM: DOS 

SOFTWARE: FastSEQ for Windows Version 2.0 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/846,705 
FILING DATE: 30-APR-1997 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: 

; FILING DATE: 

ATTORNEY/ AGENT INFORMATION: 
; NAME: PRESTIA/ PAUL F 

; REGISTRATION NUMBER: 23,031 

REFERENCE/DOCKET NUMBER: GH-70003 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 610-407-0700 
TELEFAX: 610-407-0701 
TELEX: 846169 
; INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1170 base pairs 
. TYPE: nucleic acid 

STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-846-705-1 

Query Match 99.6%; Score 1128.2; DB 2; Length 1170; 

Best Local Similarity 99.7%; Pred. No. 5.6e-260; 

Matches 1130; Conservative 0; Mismatches 3; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 



Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GT CAT C C C CT AT CTAC AGGCT GT GT C CGT GT CAGT GGCAGT GCTAACT CT CAGCTT CAT C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 8 0 

I I I I I I I I I I I I I I I I I I I I I I I- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Q'y 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GT CT GT GAT GAAC GCT GGGC AGATGAC CTCT AT C C CAAGAT CT ACCACAGTT GCTT CT TT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- 1 I I I I I I I I 

Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCT GGCT GAAGT GAAGCAGAT GC GTG CACGGAG GAAGACAGC CAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 



Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGC'GAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 102i ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

Qy • 1081 CT CAGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT CC T GAC CAT CGTGCCCCGG 1133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CT CAGT GGAT GTAAAGAGAAGAGT QTAGCT CTGT CCTGC CCAT CGT GCCC CGG 1133 



RESULT 4 

US-08-462-509B-5 

; Sequence 5, Application US/08462509B 
; Patent No. 6410701 
; GENERAL INFORMATION: 

APPLICANT: Soppet, Daniel et al 

TITLE OF INVENTION: Human Neuropeptide Receptor 
NUMBER OF SEQUENCES: 12 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Human Genome Sciences, Inc. 

; STREET: 9410 Key West Avenue 

; CITY: Rockiville 

; STATE : MD 

; COUNTRY: USA 

ZIP: 20850 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/462 , 509B 
FILING DATE: 05-JUN-1995 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: WO PCT/US95/05616 

FILING DATE: 05-MAY-1995 
; ATTORNEY/AGENT INFORMATION: 
NAME: Wales, Michele M. 
REGISTRATION NUMBER: 43,975 
; REFERENCE/ DOCKET NUMBER: PF168P1- 

TELECOMMUNICATION INFORMATION: 
TELEPHONE: 301-309-8504 
TELEFAX: 301-309-8439 
; INFORMATION FOR SEQ ID NO: 5: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1116 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
FEATURE: 

NAME/ KEY: CDS 



LOCATION: 1..1116 
US-08-462-509B-5 



Query Match 98.4%; Score 1114.4; DB 4; Length 1116; 

Best Local Similarity _99.9%; Pred. No. l.le-256; 

Matches 1115; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGACCCC 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA'*600 

Qy 601 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CT ACCAC AGT TGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 601 GT CT GT GAT GAAC GCT GGGCAGAT GAC C T CTAT C C CAAGAT CT AC CACAGT T G CTT CT TT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 



Db 



721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 



780 



Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 841 C GC GC CTT C CT G G CT GAAGT GAAGC AGAT GCGT GC AC GGAGGAAGACAGC CAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CT C AGT GGAT GT AAAGAGAAGAGT C T AGT T CT GT C C 1116 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 CT CAGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT C C 1116 



RESULT 5 

US-08-462-509B-1 

; Sequence 1, Application US/08462509B 
; Patent No. 6410701 
; GENERAL INFORMATION: 

APPLICANT: Soppet, Daniel et al 

TITLE OF INVENTION: Human Neuropeptide Receptor 
NUMBER OF SEQUENCES: . 12 
CORRESPONDENCE ADDRESS: 

ADDRESSEE : Human Genome Sciences, Inc. 

STREET: 9410 Key West Avenue 

CITY: Rockiville 

STATE: MD 

COUNTRY: USA 

ZIP: 20850 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC- DOS /MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/462, 509B 

FILING DATE: 05-JUN-1995 
; CLASSIFICATION: 435 

PRIOR APPLICATION DATA: 

APPLICATION NUMBER: WO PCT/US95/05616 

FILING DATE: 05-MAY-1995 
ATTORNEY/AGENT INFORMATION: 

NAME: Wales, Michele M. 

REGISTRATION NUMBER: 43,975 



REFERENCE/ DOCKET NUMBER: PF168P1 
; TELECOMMUNICATION INFORMATION: 
; TELEPHONE: 301-309-8504 

TELEFAX: 301-309-8439 
; INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1209 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 
; TOPOLOGY: linear 

; MOLECULE TYPE: DNA (genomic) 
FEATURE: 

NAME/ KEY: CDS 

LOCATION: 1..1209 
US-08-462-509B-1 

Query Match 95.9%; Score 1086.4; DB 4; Length 1209; 

Best Local Similarity 99.9%; Pred. No. 5.2e-250; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61TCCCCTGTGCCTC C AGACT AT GAAGAT GAGT T T CT C C GCTAT CT GT GGC GT GATT AT CT G 120 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I hi I I I I I I I I I I I I I I I I I M I I I 

Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 




Db 



241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 



Qy 



Db 



301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 



Qy 



361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

• :r " I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Mil I I I I I I I I I 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 



Db 



Qy 



421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

M I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 



Db 



Qy 



4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 




Db 



481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 



Qy 



541 



GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 



600 



Db 



I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 



Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I II 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

Qy '781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

i ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i.i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 C G CGC CTTC CT GGCT GAAGT GAAGC AGAT GC GT GCAC G GAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 102 0 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

Ml I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTT CTCC C ACT G GCT GGT GTACG C CAAC AG C GCT GC CAAC C C CAT CAT CT ACAACT T C 108 0 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1081 CTCAGTGG 1088 



RESULT 6 
US-08-846-705-4 

Sequence 4, Application US/08846705 
Patent No. 5935814 
GENERAL INFORMATION: 

APPLICANT: BERGSMA, DERK J. 
. APPLICANT : ELLIS, CATHERINE E 

TITLE OF INVENTION: NOVEL G- PROTEIN COUPLED 
NUMBER OF SEQUENCES: 5 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: RATNER & PRESTIA 
STREET: P.O. BOX 980 
CITY: VALLEY FORGE 
STATE: PA 
COUNTRY: USA 
ZIP: 19482 
COMPUTER READABLE FORM: 



MEDIUM TYPE: Diskette 
COMPUTER: IBM Compatible 
OPERATING SYSTEM: DOS 

SOFTWARE: FastSEQ for Windows Version 2.0 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER : US/08/846,705 

FILING DATE: 30-APR-1997 

CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: 

FILING DATE: 
ATTORNEY/AGENT INFORMATION: 

NAME: PRESTIA, PAUL F 

REGISTRATION NUMBER: 23,031 
; REFERENCE/DOCKET NUMBER: GH-70003 

TELECOMMUNICATION INFORMATION: 

TELEPHONE: 610-407-0700 

TELEFAX: 610-407-0701 

TELEX: 846169 
; INFORMATION FOR SEQ ID NO: 4: 
; SEQUENCE CHARACTERISTICS: 

LENGTH: 1564 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-846-705-4 

Query Match 95.9%; Score 1086.4; DB 2; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 5.6e-250; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 
Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 




Db 



154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 



Qy 



61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 




Db 



214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 



Qy 



121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 

274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 



Db 



Qy 



181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 



i i i m i i i I I I I I I I I I I I I II | | | | | | | | | | | | M | I I I i i II I I 

334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 




Db 



Qy 



241 ACCAACTACTTCATTGTC7VACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | 

394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 



Db 



Qy 



301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 




Db 



454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 



Qy 



361 



GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 



420 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



514 



421 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I I I I I I I I II I I I I I I I 

GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 



GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 



481 



634 



541 



GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I | | | | | 
GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 



G CAGT CAT G GAAT GC AGC AGTGT GCT GC CT GAGCT AGCCAAC C GC ACAC GGCT CTT CT C A 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

694 GCAGT CAT GGAAT GCAGCAGTGTGCT GCCT GAGCTAGCCAACCGCACACGGCT CTTCTCA 

601 GT CT GTGATGAACGCT GGGCAGATGACCT CTAT C CCAAGAT CTACCACAGTT GCTT CTTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | 
75 4 GT CTGT GAT GAACGCT GGGCAGATGACCTCTAT CCCAAGATCTACCACAGTTGCTT CTTT 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 



573 



480 



633 



540 



693 



600 



753 



660 



813 



720 



873 



721 



874 



781 



AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 



CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
994 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT G CGT GCAC GGAGGAAGACAGC CAAGAT GCT G 1053 

901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1174 ACCTT CT CCCACTt^feCT GGT GT ACGCCAACAGCGCTGCCAACC CCAT CAT CTACAACTT C 12.33- 

1081 CTCAGTGG 1088 

I I I I I I I I 
1234 CTCAGTGG 1241 



RESULT 7 
US-08-846-704-1 

; Sequence 1, Application US/08846704 
; Patent No. 6020157 
; GENERAL INFORMATION: 



APPLICANT: BERGSMA, DERK J. 
; APPLICANT: ELLIS, CATHERINE E. 
; TITLE OF INVENTION: NOVEL G-PROTEIN COUPLED 
NUMBER OF SEQUENCES: 4 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: RATNER & PRESTIA 
STREET: P.O. BOX 980 
CITY: VALLEY FORGE 
STATE: PA 
COUNTRY: USA 
ZIP: 19482 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: Diskette 

; COMPUTER: IBM Compatible 

OPERATING SYSTEM: DOS 
; SOFTWARE: FastSEQ for Windows Version 2.0 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/846,704 
FILING DATE: 30-APR-1997 
; CLASSIFICATION: 435 

PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: 

; FILING DATE: 

; ATTORNEY/AGENT INFORMATION: 
NAME : PRESTIA, PAUL F 
REGISTRATION NUMBER: 23,031 
REFERENCE/ DOCKET NUMBER : GH-70002 
TELECOMMUNICATION INFORMATION: 
; ) TELEPHONE: 610-407-0700 
TELEFAX: 610-407-0701 
TELEX: 846169 
; INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1564 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-846-704-1 

Query Match 95.9%; Score 1086.4; DB 3; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 5.6e-250; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 1 I I I I I I I I I I I I I I I I I I I I I I 
Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTC CAGACTAT GAAGAT GAGT T T CT C C GCT AT CT GT GGC GT GAT TAT CT G 120 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 214 TCCCCTGTGCCTC CAGACTAT GAAGAT GAGT T T CT C C GCT AT CT GT GGC GT GAT T AT CT G 273 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CT GGT GGGCAACACGCT GGT CTGCCT GGCCGT GT GGCGGAACCAC CACAT GAGGACAGT C 240 



Db 


334 


CTGGTGGGCAACACGCT.GGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 


393 


Qy 


9 /I 1 
Z 4 ± 


AbUAAbiALl 1CA1 1 Gl LAAbbl bl ccli ggctgacgttctggtgactgctatctgcctg 


300 






1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


394 


ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 


453 


Qy 


om 
oUl 


CCGGCCAGLCTGCTGG1 ggacatcactgagtcctggctgttcggccatgccctctgcaag 


360 






1 1 1 1 1 1 1 II 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


454 


ccggccagcctgctggtggacatcactgagtcctggctgttcggccatgccctctgcaag 


513 


Qy 


obi 


gtcatcccctatctacaggctgtgtccgtgtcagtggcagtgctaactctcagcttcatc 


420 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


514 


gtcatcccctatctacaggctgtgtccgtgtcagtggcagtgctaactctcagcttcatc 


573 


Qy 


4Z 1 


gccctggaccgctggtatgccatctgccacccactattgttcaagagcacagcccggcgg 


480 






1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


574 


gccctggaccgctggtatgccatctgccacccactattgttcaagagcacagcccggcgg 


633 


Qy 


481 


gcccgtggctccatcctgggcatctgggctgtgtcgctggccatcatggtgccccaggct 


540 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


634 


gcccgtggctccatcctgggcatctgggctgtgtcgctggccatcatggtgccccaggct 


693 


Qy 


r yl 1 

541 


gcagtcatggaatgcagcagtgtgctgcctgagctagccaaccgcacacggctcttctca 


600. 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


694 


gcagtcatggaatgcagcagtgtgctgcctgagctagccaaccgcacacggctcttctca 


753 


Qy 


oUl 


GT CT GT GATGAAC GCT GGGC AGAT GAC CT CTAT C C C AAGAT CTACC ACAGT T GCTT CT TT 


660 






1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 




Db 


754 


GT CT GT GAT GAAC GCT G GGC AGAT GAC CT CTAT C C CAAGAT CTACCAC AGT TGCTTCTTT 


813 


Qy 


OOl 


ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 


720 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


814 


ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 


873 


Qy 


•"JOT 
/Zl 


AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 


780 






1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 II 




Db 


874 


AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 


933 


Qy 


/ o 1 


CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 


840 






1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I | | | | || || | | | || | | | 




Db 


934 


CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 


993 


Hit 

Qy 


oil 


CGCGCCTTCCTGGCT GAAGT GAAG C AGAT GC GT GCAC GGAGGAAGACAGC CAAGATGCT G 


900 






1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | | | | | 




Db 


994 


CGCGCCTToCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG' 


1053 


wy 


q m 


AI \3\3 i bb 1 bb 1 bb 1 bbl b 1 1 bbCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 


960 






i i i i j i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

M 1 1 M M 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1054 


ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 


1113 


Qy 


961 


AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 


1020 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 




Db 


1114 


AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 


1173 



Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 



Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1234 CTCAGTGG 1241 



RESULT 8 

US-08-846-704-3. 

; Sequence 3, Application US/08846704 
; Patent No. 6020157 
; GENERAL INFORMATION: 

APPLICANT: BERGSMA, DERK J. 
APPLICANT: ELLIS f CATHERINE E. 
; TITLE OF INVENTION: NOVEL G-PROTEIN COUPLED 

NUMBER OF SEQUENCES: 4 
. CORRESPONDENCE ADDRESS: 
; ADDRESSEE: RATNER & PRESTIA 

; STREET: P.O. BOX 980 

; CITY: VALLEY FORGE 

; STATE: PA 

COUNTRY: USA 
ZIP: 19482 
COMPUTER READABLE FORM: 
MEDIUM TYPE: Diskette 
COMPUTER: IBM Compatible 
OPERATING SYSTEM: DOS 

SOFTWARE: FastSEQ for Windows Version 2.0 
; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US/08/846,704 

; FILING DATE: 30-APR-1997 

CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: 

FILING DATE: 
ATTORNEY/AGENT INFORMATION: 
NAME: PRESTIA, PAUL F 
REGISTRATION NUMBER: 23,031 
; REFERENCE/DOCKET NUMBER: GH-7 0002 

TELECOMMUNICATION INFORMATION: 
TELEPHONE: 610-407-0700 
TELEFAX: 610-407-0701 
TELEX: 846169 
; INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS : 

LENGTH: 1564 base pairs . • ^ 

; TYPE: nucleic acid 

STRANDEDNESS : single 
; TOPOLOGY: linear 

MOLECULE TYPE: cDNA 
US-08-846-704-3 

Query Match 95.9%; Score 1086.4; DB 3; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 5.6e-250; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 



154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

214 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 273 

121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTGAGCTTCATC 573 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

601 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CT AC C ACAGTT GCT T CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

754 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CT AC CAC AGTT GCT T CTT T 813 

661 ATT GT CACCT AC CT GGC C C C ACT GGGCCT CAT GG C CAT G GC CTATT T C CAGAT AT T C C G C 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3-14 ATT GT CACCT AC CT GGC C C CACT GG GCCT CAT GGC CAT GGCCTAT T 1 J CCAGAT AT T CC GC 873 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1. 1 I I I I I I I I I I I I I I I I I 



Db 



994 CGCGCCTTCCTGGCT GAAGT GAAGC AGAT GC GT GCAC GGAGGAAGACAGC CAAGAT GCTG 1053 



Qy 



Db 



901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 



Qy 



Db 



961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 



Qy 



Db 



1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 10 8 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 



Qy 



1081 CTCAGTGG 1088 



Db 



1234 CTCAGTGG 1241 



RESULT 9 

US-08-462-509B-3 

; Sequence 3, Application US/08462509B 

; Patent No. 6410701 

; GENERAL INFORMATION: 

APPLICANT: Soppet, Daniel et al 

TITLE OF INVENTION: Human Neuropeptide Receptor 
NUMBER OF SEQUENCES: 12 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Human Genome Sciences, Inc. 
STREET: 9410 Key West Avenue 
CITY: Rockiville 
STATE: MD 
COUNTRY: USA 
ZIP: 20850 
; COMPUTER READABLE FORM: 

; MEDIUM TYPE: Floppy disk 

; COMPUTER: IBM PC compatible 

; OPERATING SYSTEM: PC-DOS/MS-DOS 

; SOFTWARE: Patentln Release #1.0, Version #1.30 

; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US/08/462 , 509B 

FILING DATE: 05-JUN-1995 

CLASSIFICATION: 435 
; PRIOR APPLICATION DATA: 

; APPLICATION NUMBER: WO PCT/US95/05616 

; FILING DATE: 05-MAY-1995 

ATTORNEY/ AGENT INFORMATION: 
; NAME: Wales, Michele M. 

; REGISTRATION NUMBER: 43,975 

; REFERENCE/DOCKET NUMBER: PF168P1 

; TELECOMMUNICATION INFORMATION: 

TELEPHONE: 301-309-8504 
; TELEFAX: 301-309-8439 

; INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1110 base pairs 

TYPE: nucleic acid 



STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 1..1110 
US-08-462-509B-3 

Query Match 95.7%; Score 1084.8; DB 4; Length 1110; 

Best Local Similarity 99.8%; Pred. No. 1.2e-249; 

Matches 1086; Conservative 0; Mismatches 2; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TACCC7\AAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

- " I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I II II II I I I I 

Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I M M I II I I I II I I I II I I I I I I I II I I I I I II I I I I I I I I I I I | || I I I I I II I I 
Db 541 GCAGT CAT GGAAT GCAGC AGT GT GCT GCCT GAGCT AG CCAAC C G C ACAC GGCT CT T CT C A 600 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I M I I I I I I M I I I I I I I I I I I I II I I I I I I I I II II II I I I II I I I II I I II I I I I I I I 
Db 601 GTCT GT GAT GAAC GCT GG G CAGAT GAC CT CT ATCC CAAGAT CT ACCACAGT TGCT T CT T T 660 



Qy 



661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 



720 



Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I 

Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCT GGCT GAAGT GAAG CAGAT G C GTGCAC GGAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCT GGCT GAAGT GAAGCAGAT GC GT GCAC GGAG GAAGAC AG C CAAGATGCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTCCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1081 CTCAGTGG 1088 



RESULT 10 
PCT-US95-05616-1 

Sequence 1, Application PC/TUS9505616 
GENERAL INFORMATION: 

APPLICANT: LI, ET AL. 

TITLE OF INVENTION: Human Neuropeptide Receptor 
NUMBER OF SEQUENCES: 12 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: CARELLA, BYRNE, BAIN, GILFILLAN, 
ADDRESSEE: CECCHI, STEWART & OLSTEIN 
STREET: 6 BECKER FARM ROAD 
CITY: ROSELAND 
STATE: NEW JERSEY 
COUNTRY: USA 
ZIP: 07068 
COMPUTER READABLE FORM: 

MEDIUM TYPE: 3.5 INCH DISKETTE 
COMPUTER: IBM PS/2 
OPERATING SYSTEM: MS-DOS 
SOFTWARE: WORD PERFECT 5.1 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US95/05616 
FILING DATE: concurrently 
CLASSIFICATION: 
ATTORNEY/AGENT INFORMATION: 



NAME: FERRARO, GREGORY D. 
REGISTRATION NUMBER: 36,134 
REFERENCE/DOCKET NUMBER: 325800-268 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 201-994-1700 
; TELEFAX: 201-994-1744 

; INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1209 BASE PAIRS 
TYPE: NUCLEIC ACID 
; STRANDEDNESS : SINGLE 

; TOPOLOGY: LINEAR 

MOLECULE TYPE: cDNA 
PCT-US95-05616-1 

Query Match 95.5%; Score 1081.6; DB 5; Length 1209; 

Best Local Similarity 99.6%; Pred. No. 7.3e-249; 

Matches 1084; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
Db 61 TCCCCTGTGCCTC CAGACT AT GAAGAT GAGT T T CTC CGCT AT CT GT GGCGT GAT TAT CT G 120 

Qy 121 T AC C CAAAACAGT AT GAGT GGGT C CT CAT C G CAGCCT ATGT GGCT GT GTT CGT C GT GG C C 180 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCCCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy. 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCYAACTCTCAGCTTCATC 42 0 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | ! | | 

Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy .541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GT CT GT GAT GAAC G CT GGGCAGAT GAC CT CT AT C C CAAGATCTAC C ACAGT TGCTTCTTT 

M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GTCT GT CAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT C T ACCACAGTT G CT T CT TT 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 

I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I I I I I II II I II I I I I I I I I II I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AACCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 81 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 

Qy 841 CGCGCCTT CCTGGCTGAAGT GAAGCAGAT GCGTGCACGGAGGAAGACAGCCAAGAT GCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCT GGC T GAAGT GAAGCAGAT GCGT GCAC GGAGGAAGACAGC CAAGAT GCT G 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 AT'GGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCT'GCCCATCAGCGTCCTCAATGTCCTT 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 

Qy 1081 CTCAGTGG 1088 

I I II I I II 
Db 1081 CTCAGTGG 1088 



RESULT 11 
PCT-US95-05616-3 

; Sequence 3, Application PC/TUS9505616 
; GENERAL INFORMATION: 

APPLICANT: LI, ET AL. 

TITLE OF INVENTION: Human Neuropeptide Receptor 
NUMBER OF SEQUENCES: IS' 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: CARELLA, BYRNE, BAIN, GILFILLAN, 

; ADDRESSEE: CE'CCHI, STEWART & OLSTEIN 

STREET: 6 BECKER FARM ROAD 

CITY: ROSELAND 

STATE: NEW JERSEY 

COUNTRY: USA 

ZIP: 07068 
COMPUTER READABLE FORM: 

MEDIUM TYPE: 3.5 INCH DISKETTE 

COMPUTER: IBM PS/2 



; OPERATING SYSTEM: MS-DOS 

SOFTWARE: WORD PERFECT 5.1 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US95/05616 

FILING DATE: concurrently 
; CLASSIFICATION: 

ATTORNEY/AGENT INFORMATION: 
; NAME: FERRARO, GREGORY D. 

; REGISTRATION NUMBER: 36,134 

REFERENCE/ DOCKET NUMBER: 325800-268 
; TELECOMMUNICATION INFORMATION: 

TELEPHONE: 201-994-1700 

TELEFAX: 201-994-1744 
; INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS : 

LENGTH: 1110 BASE PAIRS 

TYPE: NUCLEIC ACID 

STRANDEDNESS: SINGLE 
; TOPOLOGY: LINEAR 

; MOLECULE TYPE: cDNA 
PCT-US95-05616-3 

Query Match 95.0%; Score 1076.8; DB 5; Length 1110; 

Best Local Similarity 99.4%; Pred. No. le-247; 

Matches 1081; Conservative 0; Mismatches 7; Indels 0; Gaps 0 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 T CC C CTGT GCCT C CAGAC TAT GAAGAT GAGT T T CT C C GCT ATCT GT GGC GT GAT TAT CT G 12 0 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 



Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I 

Db 421 CCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 



Qy 


A Q 1 
4 O 1 


GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 


540 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


481 


GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 


540 


Qy 


R A 1 


GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 


600 






1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I I I I I I I I I I I 




Db 


541 


GCAGTCATGCAATCCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 


600 


Qy 


bul 


GT CT GT GAT GAAC GCT GGG CAGAT GAC CT CT AT CC CAAGAT CT AC CAC AGTT GC T T CT T T 


660 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 II 1 




Db 


601 


CT CT GT CAT GAACG CT GGGC AGAT GAC CT CT AT CC CAAGAT CT ACCACAGTT GCT T CT T T 


660 


Qy 


661 


ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 


720 






1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | | 




Db 


661 


ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 


720 


Qy 


721 


AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 


780 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | 1 1 1 1 1 1 1 1 1 




Db 


721 


AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 


780 


Qy 


781 


CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 


840 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 


840 


Qy 


O A 1 

841 


CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 


900 






1 1 1 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


841 


CGCGCCTTCCT GGCT GAAGT GAAGCAGATGCGT GCACGGAGGAAGACAGC CAAGAT GCTG 


900 


Qy 


901 


ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 


960 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 H 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTCCCCATCAGCGTCCTCAATGTCCTT 


960 


Qy 


961 


AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 


1020 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | I | | | | 




Db 


961 


AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 


1020 


Qy 


1021 


ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 


1080 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 




Db 


1021 


ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 


1080 


Qy 


1081 


CTCAGTGG 1088 




Db 


1081 


1 1 1 1 1 1 1 1 

CTCAGTGG 1088 





RESULT 12 

US-08-513-974B-375 

Sequence 375, Application US/08513974B 
Patent No. 6114139 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Hinuma, Shuji 
Hosoya, Masaki 
Fujii, Ryo 
Ohtaki, Tetsuya 
Fukusumi, Shoji 
Ohgi, Kazuhiro 



TITLE OF INVENTION: G PROTEIN COUPLED RECEPTOR PROTEIN, 
TITLE OF INVENTION: PRODUCTION, AND USE THEREOF 
NUMBER OF SEQUENCES: 380 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: DIKE, BRONSTEIN, ROBERTS & CUSHMAN, LLP 

STREET: 130 Water Street 

CITY: Boston 

STATE: MA 

COUNTRY: USA 

ZIP: 02109 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/513, 974B 

FILING DATE: 14-SEP-1995 

CLASSIFICATION: 536 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: PCT/ JP95/01599 

FILING DATE: 10-AUG-1995 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 7-093989 

FILING DATE: 19-AUG-1995 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 7-057186 

FILING DATE: 16-MAR-1995 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 7-007177 

FILING DATE: 20-JAN-1995 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-326611 

FILING DATE: 28-DEC-1994 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-270017 

FILING DATE: 02-NOV-1994 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-236357 

FILING DATE: 30-SEP-1994 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-236356 

FILING DATE: 30-SEP-1994 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-189274 

FILING DATE: ll-AUG-1994 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-189273 

FILING DATE: ll-AUG-1945 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-189272 

FILING DATE: ll-AUG-1994 
ATTORNEY/AGENT INFORMATION: 

NAME: Resnick, David S. 

REGISTRATION NUMBER: 34,235 

REFERENCE/ DOCKET NUMBER: 45753 
TELECOMMUNICATION INFORMATION: 



TELEPHONE: 617-523-3400 
. TELEFAX: 617-523-6440 
INFORMATION FOR SEQ ID NO: 375: 
SEQUENCE CHARACTERISTICS : 
LENGTH: 843 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 28.. 816 
US-08-513-974B-375 

Query Match 61.6%; Score 697.6; DB 3; Length 843; 

Best Local Similarity 89.9%; Pred. No. 2.4e-157; 

Matches 748; Conservative 0; Mismatches 84; Indels 0; Gaps 0; 

Qy 252 CATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCT 311 

I I III I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I II 
Db 9 CGTGTTCATCCTGTCACTGGCCGATGTGCTGGTGACAGCCATCTGCCTGCCGGCCAGTCT 68 

Qy 312 GCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTA 371 

I I I I I I I I I I I I I I II- I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 69 GCTGGTAGACATCACGGAATCCTGGCTCTTTGGCCATGCCCTCTGCAAGGTCATCCCCTA 12 8 

Qy 372 TCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCG 431 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 9 TCTACAGGCCGTGTCCGTGTCAGTGGTCGTGCTGACTCTCAGCTCCATCGCCCTGGACCG 18 8 

Qy 432 CTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTC 491 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 189 CTGGTACGCCATCTGCCACCCGCTGTTGTTCAAGAGCACTGCCCGGCGCGCCCGCGGCTC 248 

Qy 492 CATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGA 551 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I 
Db 249 CATCCTCGGCATCTGGGCGGTGTCGCTGGCTGTCATGGTGCCTCAGGCTGCTGTCATGGA 308 

Qy 552 ATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGA 611 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II III I II I I I I I I I I I I I 
Db 309 GTGTAGCAGCGTGCTGCCCGAGCTGGCCAACCGCACCCGCCTCCTGTCTGTCTGTGATGA 368 

Qy 612 ACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTA 671 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 369 GCGCTGGGCAGACGACCTGTACCCCAAGATCTACCACAGCTGCTTCTTCATTGTCACCTA 428 

. ./ 

Qy 672 CCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGG 731 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 429 CCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATCTTCCGCAAGCTCTGGGG 488 

Qy 732 CCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCA 7 91 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 4 89 CCGCCAGATCCCCGGCACCACCTCGGCCCTGGTGCGCAACTGGAAGCGGCCCTCAGACCA 54 8 

Qy 7 92 GCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCT 851 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 549 GCTGGACGACCAGGGCCAGGGCCTGAGCTCAGAGCCCCAGCCCCGGGCCCGCGCCTTCCT 608 



Qy .. 852 GGCTGAAGT GAAGCAGAT GC GT GCAC GGAGGAAGAC AGC CAAGAT GCT GAT GGT GGT GCT 911 

III II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 609 GGCCGAGGT GAAACAGAT GC GAGC C C GGAGGAAGAC GG C CAAGAT GCT GAT G GT G GT GCT 668 

Qy 912 GCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTT 971 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 669 GCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGTGTCCTCAACGTCCTCAAGAGGGTCTT 728 

Qy 972 CGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCA 1031 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I I I I I I I I I I 
Db 729 CGGGATGTTCCGCCAAGCCAGCGACCGAGAGGCCATCTACGCCTGCTTCACCTTCTCCCA 78 8 

Qy • 1032 CTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTCCTC 1083 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I I I II I I I I I I I 
Db 789 CTGGCTGGTGTACGCCAACAGCGCCGCCAATCCCCTCCTCTACTCCTTCCTC 84 0 



RESULT 13 
US-08-513-974B-55 

Sequence 55, Application US/08513974B 
Patent No. 6114139 
GENERAL INFORMATION: 

APPLICANT: Hinuma, Shuji 
APPLICANT: Hosoya, Masaki 
APPLICANT: Fujii, Ryo 
APPLICANT: Ohtaki, Tetsuya 
APPLICANT: Fukusumi, Shoji 
APPLICANT : Ohgi, Kazuhiro 

TITLE OF INVENTION: G PROTEIN COUPLED RECEPTOR PROTEIN, 
TITLE OF INVENTION: PRODUCTION, AND USE THEREOF 
NUMBER OF SEQUENCES: 380 
CORRESPONDENCE ADDRESS : 

ADDRESSEE: DIKE, BRONSTEIN, ROBERTS & CUSHMAN, LLP 
STREET: 130 Water Street 
CITY: Boston 
STATE : MA 
COUNTRY: USA 
ZIP : 02109 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 08/513, 974B 
FILING DATE: 14-SEP-1995 
CLASSIFICATION: 536 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: PCT/ JP95/01599 
FILING DATE: 10-AUG-1995 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 7-093989 
FILING DATE: 19-AUG-1995 
PRIOR APPLICATION DATA:- 

APPLICATION NUMBER: JP 7-057186 
FILING DATE: 16-MAR-1995 



; PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 7-007177 
FILING DATE: 20-JAN-1995 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-326611 
; FILING DATE: 28-DEC-1994 

PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-270017 
FILING DATE: 02 -NOV- 19 94 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-236357 
FILING DATE: 30-SEP-1994 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-236356 
FILING DATE: 30-SEP-1994 
; PRIOR APPLICATION DATA: 

; APPLICATION NUMBER: JP 6-189274 

FILING DATE: ll-AUG-1994 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-189273 
FILING DATE: ll-AUG-1945 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 6-189272 
; FILING DATE: ll-AUG-1994 

ATTORNEY/AGENT INFORMATION: 
;. NAME: Resnick, David S. 

REGISTRATION NUMBER: 34 , 235 
REFERENCE/ DOCKET NUMBER: 45753 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 617-523-3400 
; TELEFAX: 617-523-6440 

; INFORMATION FOR SEQ ID NO: 55: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 789 base pairs 

; TYPE: nucleic acid 

STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-08-513-974B-55 

Query Match 59.2%; Score 670.6; DB 3; Length 789; 

Best Local Similarity 90.6%; Pred. No. 6.5e-151; 

Matches 715; Conservative 0; Mismatches 74; Indels 0; Gaps 0 
Qy 271 GCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGGACATCACTGAG 330 




Db 



1 GCCGATGTGCTGGTGACAGCCATCTGCCTGCCGGCCAGTCTGCTGGTAGACATCACGGAA 60 



Qy 



331 TCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGGCTGTGTCCGTG 390 




Db 



61 TCCTGGCTCTTTGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGGCCGTGTCCGTG 120 



Qy 



391 TCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATGCCATCTGCCAC 450 




Db 



121 TCAGTGGTCGTGCTGACTCTCAGCTCCATCGCCCTGGACCGCTGGTACGCCATCTGCCAC 180 



Qy 



451 CCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGGGCATCTGGGCT 510 



Db 


181 


Qy 


511 


Db 


241 


Qy 


571 


Db 


301 


Qy 


631 


Db 


361 


Qy 


691 


Db 


421 


Qy 


751 


Db 


481 


Qy 


811 


Db 


541 


Qy 


871 


Db 


601 


Qy 


931 


Db 


661 


Qy 


991 


Db 


721 


Qy 


1051 


Db 


781 



II II I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 1 

CCGCTGTTGTTCAAGAGCACTGCCCGGCGCGCCCGCGGCTCCATCCTCGGCATCTGGGCG 24 0 

GTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCT 57 0 
I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I | | || | | | | | I I I M I I I 
GTGTCGCTGGCTGTCATGGTGCCTCAGGCTGCTGTCATGGAGTGTAGCAGCGTGCTGCCC 300 

GAGCT AGC CAAC C GCACACGG CT CT T CTCAGT CT GT GAT GAAC GCT GGGC AGAT GACCT C 630 

I I I I I I I I M I I I I I I II III I II I I I I I I I I I I I I I I I I I I I I I 

GAGCTGGCCAACCGCACCCGCCTCCTGTCTGTCTGTGATGAGCGCTGGGCAGACGACCTG 360 

TATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTC 690 
M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I 
TACCCCAAGATCTACCACAGCTGCTTCTTCATTGTCACCTACCTGGCCCCACTGGGCCT.C 420 

ATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACC 750 
I M I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCCATGGCCTATTTCCAGATCTTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACC 480 

ACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAG 810 
Mill II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Ml 
ACCTCGGCCCTGGTGCGCAACTGGAAGCGGCCCTCAGACCAGCTGGACGACCAGGGCCAG 54 0 

GGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATG 870 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I | M I I I I I I 
GGCCTGAGCTCAGAGCCCCAGCCCCGGGCCCGCGCCTTCCTGGCCGAGGTGAAACAGATG 600 

CGTGCACGGAGGAAGACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGC 930 
M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGAGCCCGGAGGAAGACGGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGC 660 

TACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCC 990 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TACCTGCCCATCAGTGTCCTCAACGTCCTCAAGAGGGTCTTCGGGATGTTCCGCCAAGCC 720 

AGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAAC 1050 
M I I M I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCGACCGAGAGGCCATCTACGCCTGCTTCACCT-TCTCCCACTGGCTGGTGTACGCCAAC 780 . 

AGCGCTGCC 1059 
I I I I I III 



RESULT 14 
US-09-461-436B-55 

; Sequence 55, Application US/09461436B 
; Patent No. 6538107 

GENERAL INFORMATION: 
; APPLICANT: Shuji Hinuma 

; Yasuaki Ito 

; Ryo Fujii 

TITLE OF INVENTION: G Protein Coupled Receptor Protein, 
; Production, And Use Thereof 

NUMBER OF SEQUENCES: 61 

CORRESPONDENCE ADDRESS: 

ADDRESSEE: Edwards & Angell, LLP 



STREET: 101 Federal Street 
CITY: BOSTON 
STATE: MA 
COUNTRY: USA 
ZIP : 02209 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 (EPO) 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/461, 436B 

FILING DATE: 14-Dec-1999 

CLASSIFICATION: <Unknown> 
; PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/513,974 

FILING DATE: 14-SEP-1995 

APPLICATION NUMBER: PCT/ JP95/01599 

FILING DATE: 10-AUG-1995 
; APPLICATION NUMBER: 7-093989 

; FILING DATE: 19-APR-1995 

APPLICATION NUMBER: 7-057186 

FILING DATE: 16-MAR-1995 

APPLICATION NUMBER: 7-007177 

FILING DATE: 20-JAN-1995 

APPLICATION NUMBER: 6-326611 

FILING DATE: 28-DEC-1994 

APPLICATION NUMBER: 6-270017 

FILING DATE: 02-NOV-1994 
; APPLICATION NUMBER: 6-236357 

FILING DATE: 30-SEP-1994 

APPLICATION NUMBER: 6-236356 

FILING DATE: 30-SEP-1994 

APPLICATION NUMBER: 6-189274 
; FILING DATE: ll-AUG-1994 

APPLICATION NUMBER: 6-189273 

FILING DATE: ll-AUG-1994 

APPLICATION NUMBER: 6-189272 
; FILING DATE: ll-AUG-1994 

ATTORNEY/AGENT INFORMATION: 

NAME: CONLIN, DAVID G. 

REGISTRATION NUMBER: <Unknown> 

REFERENCE/ DOCKET NUMBER: 45753 DIV2 
; TELECOMMUNICATION INFORMATION: 

TELEPHONE: 617-439-4444 
• TELEFAX: 617-439-4170 
INFORMATION FOR SEQ ID NO: 55: 
SEQUENCE CHARACTERISTICS: 
; LENGTH: 789 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 55: 
US-09-461-436B-55 



Query Match 



59.2%; Score 670.6; DB 4; Length 789; 



Best Local Similarity 90.6%; Pred. No. 6.5e-151; 

Matches 715; Conservative 0; Mismatches 74; Indels 0; Gaps 0; 



Qy 271 GCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGGACATCACTGAG 330 

II II M I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1 GCCGATGTGCTGGTGACAGCCATCTGCCTGCCGGCCAGTCTGCTGGTAGACATCACGGAA 60 

Qy 331 TCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGGCTGTGTCCGTG 390 

I I I I I I I I II I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TCCTGGCTCTTTGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGGCCGTGTCCGTG 120 

Qy 391 TCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATGCCATCTGCCAC 450 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TCAGTGGTCGTGCTGACTCTCAGCTCCATCGCCCTGGACCGCTGGTACGCCATCTGCCAC 180 

Qy 451 CCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGGGCATCTGGGCT 510 

II M 1111111111111111111111 I I I II I I I I I. I I I I I I I I I I I I II I I I 

Db 181 CCGCTGTTGTTCAAGAGCACTGCCCGGCGCGCCCGCGGCTCCATCCTCGGCATCTGGGCG 240 

Qy 511 GTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCT 57 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I 
Db 241 GTGTCGCTGGCTGTCATGGTGCCTCAGGCTGCTGTCATGGAGTGTAGCAGCGTGCTGCCC 300 

Qy 571 GAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGGCAGATGACCTC 630 

I I I I I I I I I I I I I I I I II III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 GAGCTGGCCAACCGCACCCGCCTCCTGTCTGTCTGTGATGAGCGCTGGGCAGACGACCTG 360 

Qy 631 TAT C C CAAGATCT AC C ACAGTT GCT T CT TTAT T GT CAC CT ACCT GG CC C CACT GGGC CT C 690 

II Ml I I I I I I I I M I I I | | | | | | | | | | | | | | | | | | | | | | II I I I 

Db 361 T AC C CCAAGAT CT AC CACAGCT GCT T CTT CAT T GT CAC CT AC C T GGCCC CACT GGGC CT C 420 

Qy 691 ATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACC 750 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 421 ATGGCCATGGCCTATTTCCAGATCTTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACC 480 

Qy 751 ACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAG 810 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I MM M III 

Db 481 ACCTCGGCCCTGGTGCGCAACTGGAAGCGGCCCTCAGACCAGCTGGACGACCAGGGCCAG 540 

Qy 811 GGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATG 87 0 

Mill!!! I II I I I I II I II I I I I I I I II I I II II II I I I II I I I I I I I II II 
Db 541 GGCCTGAGCTCAGAGCCCCAGCCCCGGGCCCGCGCCTTCCTGGCCGAGGTGAAACAGATG 600 

Qy 871 CGTGCACGGAGGAAGACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGC 930 

II M I I I I II I I I I I I I I I I I II II II II I II I I II II M I I II I II I I II I I II I I 

Db 601 CGAGCCCGGAGGAAGACGGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGC 660 

Qy 931 TACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCC 990 

I I M I I I I I I I I I I I II I I I I I II I I I II I I I I II I II II II I I I I II I II II I II 
Db 661 TACCTGCCCATCAGTGTCCTCAACGTCCTCAAGAGGGTCTTCGGGATGTTCCGCCAAGCC 720 

Qy 991 AGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAAC 1050 

M I II II II II I II II I I I II I I I II I I I I II II I I II I I I II I II II II II M I 
Db 721 AGCGACCGAGAGGCCATCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAAC 780 



Qy 1051 AGCGCTGCC 1059 

Mill II I 



Db 



781 AGCGCCGCC 789 



RESULT 15 
US-09-119-788-1 

; Sequence 1, Application US/09119788 
; Patent No. 6166193 
; GENERAL INFORMATION: 

APPLICANT: Yanagisawa, Masashi 

TITLE OF INVENTION: CDNA CLONE MY1 THAT ENCODES 
TITLE OF INVENTION: A NOVEL HUMAN 7 -TRANSMEMBRANE RECEPTOR 
; NUMBER OF SEQUENCES: 2 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: SmithKline Beecham Corporation 

STREET: 709 Swedeland Road 
; CITY: King of Prussia 

STATE: PA 

COUNTRY: United States of America 

ZIP: 19406 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: Diskette 

COMPUTER: IBM Compatible 
; OPERATING SYSTEM: DOS 

SOFTWARE: FastSEQ for Windows Version' 2.0 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/119,788 
; FILING DATE: 21-JUL-1998 

CLASSIFICATION: 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 60/053,790 

FILING DATE: 25-JUL-1997 
ATTORNEY/AGENT INFORMATION: 

NAME: King, William T 

REGISTRATION NUMBER: 30,954 
; REFERENCE/ DOCKET NUMBER: GH50029 

TELECOMMUNICATION INFORMATION: 
; TELEPHONE: 610-270-5515 

TELEFAX: 610-270-5090 

TELEX : 

; INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1633 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
; ' MOLECULE TYPE: Genomic DNA 
US-09-119-788-1 

Query Match 46.0%; Score 520.8; DB 3; Length 1633; 

Best Local Similarity 70.5%; Pred. No. 4.2e-115; 

Matches 712; Conservative 0; Mismatches 292; Indels 6; Gaps 1 

Qy 80 AT GAAGAT GAGTTT CT CCGCT AT CT GT GGCGT GATTATCTGTACCCAAAACAGT AT GAGT 139 

I M II II II II II I I I I I I I I I II II III I I I I III I I I II I II 
Db 217 AC GAC GAG GAATTCCT GC GGT AC CT GT GGAGG GAATAC CT GCAC C C GAAAGAAT AT GAGT 276 



QY 



14 0 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 



1 1 1 1 1 1 1 1 1 1 1 1 I II I 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 I 1 1 1 1 1 1 1 1 1 

277 GGGTCCTGATCGCCGGGTACATCATCGTGTTCGTCGTGGCTCTCATTGGGAACGTCCTGG 336 

200 TCTGCCTGGCCGTGT GGC GGAAC C AC CAC AT GAGGACAGT CAC CAACT ACTT CAT T GT CA 259 

I M I I I I MINI I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I MM 

337 T T T GT GT G GC AGT GT GGAAGAAC CAC CACAT GAG GAC G GTAAC CAACT ACT T CAT AGT CA 39 6 

260 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I I I M M II I II I II II II I II I I II II I II II I I II I I I II I 

397 ATCTTTCTCTGGCTGATGTGCTCGTGACCATCACCTGCCTTCCAGCCACACTGGTCGTGG 45 6 

320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 

I II II II II I II I II I M II II II II II II I II II II II II II II I 
457 AT AT CACTGAGACCTGGTTTTTT GGACAGTCCCTTTGCAAAGT GATT C CTT ATCTACAGA 516 

38 0 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I Mill I I I II III I II II II II II I I III I I I II II II II II I M 
517 CCGTGTCGGTGTCTGTGTCTGTCCTCACACTGAGCTGTATCGCCTTGGATCGGTGGTATG 57 6 

440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 499 

I II II I II II I I I I II II I II II I I II I II I I I I II I I III I 

577 CAATCTGTCACCCTTTGATGTTTAAGAGCACAGCAAAGCGGGCCCGTAACAGCATTGTCA 636 

500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I II II II II I II II I I I I I I II I I I II I I II II II I I I I I 

637 T CAT CT GGAT T GT CT C CT GCATT AT AAT GATT C CT CAGGC CAT CGT C AT GGAGT GC AGCA 696 

560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

II I I II I -1111111 II II I II I II I I I I II I I I I I I I II 

697 CCGTGTTCCCAGGCTTAGCCAATAAAACCACCCTCTTTACGGTGTGTGATGAGCGCTGGG 756 

620 CAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCC 679 

I I I I ' I I M I I I I I II I M I I I II II I I I II I I I I II I I I I I I I I 

757 GT GGTGAAAT T T AT CC CAAGAT GT AC CACATCT GT T T CT T T CT GGT GACAT ACAT GGCAC 816 

680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

II I I I I I II II II Mil III I II I II I I II II I II I II I III I II I 

817 CACTGTGTCTCATGGTGTTGGCTTATCTGCAAATATTTCGCAAACTCTGGTGTCGACAGA 876 

74 0 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

II I I I I II I II I I I I I I I II I II I I II I I I I I 

877 T C C CT GGAAC AT CAT CT GT AGTT C AGAGAAAAT GGAAGC C C C TGCAGCCTGTTT 930 

800 ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

II I III I I I I II II I I I I I I I II II II 

931 CAGAGCCT C GAG GGC C AGGACAG C CAACGAAGT C C CGGAT GGG C GCTGT GGC GGCI GAAA 990 

860 TGAAGCAGAT GCGTGCACGGAGGAAGACAGCCAAGATGCT GAT GGTGGT GCT GCTGGT CT 919 

I I I II I I II II II I II I I I I II II I II II I I I I I II I I I II II I I I 
991 TAAAGCAGATCCGAGCCAGAAGGAAAACAGCCCGGATGTTGATGGTTGTGCTTTTGGTAT 1050 

920 TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 97 9 
I II I II II I II II II III II I I I II I II II I I II I I I II II II II I 
1051 TTGCAATTTGCTATCTACCAATTAGCATCCTCAATGTGCTA7^AGAGAGTATTTGGGATGT 1110 

980 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 
I III I II I I II I II I II I II II II II I II I I II II II II I 



Db 1111 T T GCCC AT ACT GAAGAC AGAGAGAC T GT GTAT GCCT GGT T T AC CT T TT CAC ACT G GCT T G 1170 

Qy 1040 TGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTCCTCAGTGGA 108 9 

I II I I I I I II I I I I I II II II II II II II I I I I I I I I I 
Db 1171 T AT ATGC CAAT AGT GCT GC GAAT C CAAT T ATT T AT AAT T T T CT CAGT GGA 1220 



Search completed: October 15, 2004, 22:55:10 
Job time : 90.8123 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



October 15, 2004, 19:59:43 ; Search time 584.359 Seconds 

(without alignments) 
9829.265 Million cell updates/se 

US-10-070-532-5 
1133 

1 atggagccctcagccacccc tcctgaccatcgtgccccgg 1133 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



3340653 seqs, 2534783454 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6681306 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database : 
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/cgn2_6/ptodata/l/pubpna/US07_PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/PCT_NEW_PUB.seq: * 
/cgn2_6/ptodata/l/pubpna/US06_NEW_PUB.seq:* 
/cgn2_6/ptodata/l/pubpna/US06_PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/US07_NEW_PUB. seq: * 
/cgn2_6/ptodata/l/pubpna/PCTUS_PUBCOMB.seq: * 
/cgn2_6/ptodata/l/pubpna/US08_NEW_PUB.seq: * 
/cgn2_6/ptodata/l/pubpna/US08_PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/US09A_PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/US09B_PUBCOMB.seq: 
/cgn2_6/ptodata/l/pubpna/US09C_PUBCOMB. seq: 
/cgn2_6/ptodata/l/pubpna/US09_NEW_PUB.seq:* 
/cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq2 : 
/cgn2_6/ptodata/l/pubpna/US10A_PUBCOMB. seq: 
/cgn2_6/ptodata/l/pubpna/US10B_PUBCOMB. seq: 
, /'cgn2_6/ptodata/l/pubpna/US10C_PUBCOMB. seq: 
/cgn2_6/ptodata/l/pubpna/US10_NEW_PUB. seq:* 
/cgn2__6/ptodata/l/pubpna/US60_NEW_PUB.seq: * 
/cgn2_6/ptodata/l/pubpna/US60_PUBCOMB. seq: * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
US-09-393-696-5 

; Sequence 5, Application US/09393696 
; Publication No. US20030022277A1 
; GENERAL INFORMATION: 



APPLICANT: Human Genome Sciences , Inc. et al. 
TITLE OF INVENTION: Human Neuropeptide Receptor 
FILE REFERENCE: PF168P2 

CURRENT APPLICATION NUMBER: US/09/393, 696 
CURRENT FILING DATE: 1999-09-10 
EARLIER APPLICATION NUMBER: PCT/US95/ 05616 
EARLIER FILING DATE: 1995-05-05 
EARLIER APPLICATION NUMBER: US08/4 62,509 
EARLIER FILING DATE: 1995-06-05 
NUMBER OF SEQ ID NOS : 23 
SOFTWARE: Patentln Ver. 2.0 
SEQ ID NO 5 
LENGTH: 1133 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (1) . . (1131) 
US-09-393-696-5 

Query Match 99.9%; Score 1131.4; DB 10; Length 1133; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1132; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGACCCC 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 61 TCCCCTGTGCCTC C AGACT ATGAAGAT GAGT T T CT C C GCTAT CT GT GGC GT GAT TAT CTG 120 

Qy 121 TACCCTUWVCAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I II I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I i ri l l I I I I I I I 1 1 I I 1 1 I 1 1 1 1 I I I I 1 1 I I I I I I I 1 1 1 1 1 1 1 1 1 I I I I I I i n I I I I 

Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 



Qy 



481 



GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 



540 



I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GC AGT CAT GGAAT GCAGCAGT GTGCTGCCT GAGCT AGC CAAC C GCAC AC GGC T CTT CT CA 600 

Qy 601 GTCT GT GAT GAACGCTGGGCAGATGACCT CTATCCCAAGAT CTACCACAGTT GCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db , 601 GTCT GT GAT GAACGCTGGGCAGAT GACCT CT AT CCCAAGAT CTACCACAGTT GCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 CGCGCCTT C CT GGCTGAAGT GAAGCAGAT GCGT GCACGGAGGAAGACAGCCAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CT CAGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT CCT GAC CAT CGTGCCCCGG 1133 

I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1081 CT CAGT GGAT GTAAAGAGAAGAGT CT AGT T CT GT C CT GAC CAT CGTGCCCCGG 1133 



RESULT 2 

US-10-077-874-5 , - 

; Sequence 5, Application US/10077874 
; Publication No. US20020115155A1 
GENERAL INFORMATION: 

APPLICANT: Soppet, Daniel et al 
; TITLE OF INVENTION: Human Neuropeptide Receptor 

; NUMBER OF SEQUENCES: 12 

CORRESPONDENCE ADDRESS: 

ADDRESSEE: Human Genome Sciences, Inc. 
STREET: 9410 Key West Avenue 
CITY: Rockville 
; STATE: MD 



COUNTRY: USA 
ZIP : 20850 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/10/077,874 
FILING DATE: 20-Feb-2002 
CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/462,509 
FILING DATE: 05-JUNE-1995 
ATTORNEY/AGENT INFORMATION: 
NAME: Wales, Michele M. 
REGISTRATION NUMBER: 43,975 
REFERENCE/DOCKET NUMBER: PF168P1D1 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 301-309-8504 
TELEFAX: 301-309-8439 
INFORMATION FOR SEQ ID NO: 5: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1116 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 1..1116 
SEQUENCE DESCRIPTION: SEQ ID NO: 5: 
US-10-077-874-5 

Query Match 98.4%; Score 1114.4; DB 14; Length 1116; 

Best Local Similarity 99.9%; Pred. No. 6.2e-311; 

Matches 1115; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 
Qy 1 AT GGAGC C CT C AGC C AC C C C AGGGGC C C AGAT GGGGGT C C CC CCT GGCAGCAGAGAGC C C 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I III 

Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGACCCC 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 



QY 
Db 



241 
241 



ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 



300 
300 



Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I II I I II I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGG.CTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GT CT GT GAT GAAC GCT G GGCAGAT GAC CT CT AT C C CAAGAT CT AC CACAGT T GCT T CTTT 660 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | 
Db 601 GT CT GT GAT GAAC G CT GGG C AGAT GACCT CT AT C C CAAGAT CT AC CACAGT TGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GC AC GGAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT G C AC G GAGGAAGACAGC CAAGATGCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC- 1020 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CTCAGTGGATGTAAAGAGAAGAGTCTAGTTCTGTCC 1116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CTCAGTGGATGTAAAGAGAAGAGTCTAGTTCTGTCC 1116 



RESULT 3 

US-10-225-567A-367 

; Sequence 367, Application US/10225567A 

; Publication No. US20030113798A1 

; GENERAL INFORMATION: ' 

; APPLICANT: Lifespan Biosciences 

APPLICANT: Brown, Joseph P. 
; APPLICANT: Burmer, Glenna C. 
; APPLICANT: Roush, Christine L. 

; TITLE OF INVENTION: ANTIGENIC PEPTIDES AND ANTIBODIES FOR G PROTEIN-COUPLED 

RECEPTORS (GPCRS) 

; FILE REFERENCE: 1920-4-4 

; CURRENT APPLICATION NUMBER: US/10/225, 567A 

; CURRENT FILING DATE: 2001-12-19 

; PRIOR APPLICATION NUMBER: 60/257,144 

; PRIOR FILING DATE: 2000-12-19 

; NUMBER OF SEQ ID NOS : 2292 

; SOFTWARE: Patentln version 3.1 

; SEQ ID NO 367 

LENGTH: 1564 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-225-567A-367 

Query Match 95.9%; Score 1086.4; DB 15; Length 1564; 

Best Local Similarity 99.9%; Pred. No. 8e-303; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 AT G GAGC C CT C AGC CAC C C CAGGG GC C C AGAT GGGGGT C C C C C CT G GCAGCAGAGAGC C C 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 154 AT G GAGC C CT CAGC CAC C C CAGGGGC C C AGAT GGGGGT C C C C C CT GGCAGCAGAGAGC C G 213 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 214 T C C C CT GTGC CT C C AGACT ATGAAGAT GAGT T T CT CC GCT AT CT GT GGCGT GAT T AT CT G 273 

Qy 121 T AC C CAAAACAGT AT GAGT GGGT CCT CAT C GCAGCCTAT GT GGCT GT GTT CGT C GT GGC C 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 

Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 



Qy 

Db 



361 
514 



420 
573 



Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1. 1 
Db 574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGC.CAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694. GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 
Db 754 GT CT GTGAT GAAC GCT GGGCAGAT GAC CT CT AT CCCAAGAT CT AC CACAGT TGCTTCTTT 813 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 7 81 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 994 C GC GCCTT C CT GGCT GAAGT GAAG C AGAT GC GT GCACGGAG GAAGAC AGC CAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I II I I I || I I I I 
Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCT^CAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

. I I I I I I I I 
Db 1234 CTCAGTGG 1241 



RESULT 4 

US-10-352-684A-21 

; Sequence 21, Application US/10352684A 
; Publication No. US20030215452A1 
; GENERAL INFORMATION: 

; APPLICANT: Millennium Pharmaceuticals Inc. 
; APPLICANT: Carroll, Joseph M. 
; APPLICANT: Healy, Aileen 



APPLICANT: Weich, Nadine S. 
APPLICANT: Kelly,. Louise M. 

TITLE OF INVENTION: METHODS AND COMPOSITIONS FOR TREATING 

TITLE OF INVENTION: HEMATOLOGICAL DISORDERS USING 131, 148, 199, 12303, 
13906, 

; TITLE OF INVENTION: 15513, 17822, 302, 5677, 194, 14393, 28059, 7366, 12212, 
; TITLE OF INVENTION: 1981, 261, 12416, 270, 1410, 137, 1871, 13051, 1847, 
1849, 

TITLE OF INVENTION: 15402, 340, 10217, 837, 1761, 8990 OR 13249 MOLECULES 
FILE REFERENCE: MPI02-019P1RNOMNIM 
CURRENT APPLICATION NUMBER: US/10/352 , 684A 
CURRENT FILING DATE: 2.003-01-28 
PRIOR APPLICATION NUMBER: US 60/354,333 
PRIOR FILING DATE: 2002-02-04 
PRIOR APPLICATION NUMBER: US 60/360,258 
PRIOR FILING DATE: 2002-02-28 
PRIOR APPLICATION NUMBER: US 60/364,476 
PRIOR FILING DATE: 2002-03-15 
PRIOR APPLICATION NUMBER: US 60/375,626 
PRIOR FILING DATE: 2002-04-26 
PRIOR APPLICATION NUMBER: US 60/386,494 
PRIOR FILING DATE: 2002-06-06 
PRIOR APPLICATION NUMBER: US 60/390,965 
PRIOR FILING DATE: 2002-06-24 
PRIOR APPLICATION NUMBER: US 60/392,480 
PRIOR FILING DATE: 2002-06-28 
PRIOR APPLICATION NUMBER: US 60/394,128 
PRIOR FILING DATE: 2002-07-03 
PRIOR APPLICATION NUMBER: US 60/399,783 
PRIOR FILING DATE: 2002-07-31 
PRIOR APPLICATION NUMBER: US 60/403,221 
PRIOR FILING DATE: 2002-08-13 

Remaining Prior Application data removed - See File Wrapper or PALM. 
NUMBER OF SEQ ID NOS : 62 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 21 
LENGTH: 1564 
TYPE: DNA 

ORGANISM: Homo Sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (154) .. . (1431) 
US-10-352-684A-21 

Query Match 95.9%; Score 1086.4; DB 16; Length 1564; 

Best Local Similarity 99.9%; Prod. No. 8e-303; 

Matches 1087; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 TCCCCTGTGCCTC C AGACTAT GAAGAT GAGT T T CT C C GCT AT CT GT G GC GTGAT TAT CT G 273 



Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 



2 7 4 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | | | | | I I 

334 CT GGT GGGCAACACGCT GGT CT GCCT GGCC GT GT GGCGGAAC CACCACAT GAGGACAGT C 393 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | | | 
394 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

361 GT CAT CCCCTATCTACAGGCT GT GT CCGT GT CAGT GGCAGTGCT AACT CT CAGCTT CAT C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

574 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 633 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

541 GC AGT CAT GGAAT GCAGCAGT GT G CT GC CT GAG CT AGC CAAC CGCACACGGCT CTT CT CA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

601 GT CTGT GATGAACGCTGGGCAGAT GACCT CT AT CCCAAGAT CTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

754 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CT ACC ACAGTT GCTT CT TT 813 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I | I I I I I I I I I I I I I I I II I I I I I I I 
934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

841 C GC GC CT TCCTGGCT GAAGT GAAGCAGAT GC GT GC ACGGAGGAAGAC AGCCAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
994 CGC GCCT TCCTGGCT GAAGT GAAGCAGAT GCGTGCACGGAGGAAGACAGC CAAGAT GCT G 1053 

901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I II I I I I 
1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 



961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 102 0 
I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1174 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1233 

Qy 1081 CTCAGTGG 1088 

MINIM 
Db 1234 CTCAGTGG 1241 



RESULT 5 
US-10-077-874-3 

; Sequence 3, Application US/10077874 
; Publication No. US20020115155A1 
; GENERAL INFORMATION : 

; APPLICANT: Soppet, Daniel et al 

TITLE OF INVENTION: Human Neuropeptide Receptor 
NUMBER OF SEQUENCES: 12 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Human Genome Sciences, Inc. 

STREET: 9410 Key West Avenue 
CITY: Rockville 
STATE: MD 
COUNTRY: USA 
; ZIP: 20850 

COMPUTER READABLE FORM: 
; MEDIUM TYPE: Floppy disk 

; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.30 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/10/077, 874 
FILING DATE: 20-Feb-2002 
CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: 08/462,509 

FILING DATE: 05-JUNE-1995 
; ATTORNEY/AGENT INFORMATION: 

; NAME: Wales, Michele M. 

; REGISTRATION NUMBER: 43,975 

; REFERENCE/ DOCKET NUMBER: PF168P1D1 

TELECOMMUNICATION INFORMATION: 
TELEPHONE: 301-309-8504 
TELEFAX: 301-309-8439 
INFORMATION FOR SF.Q IZ)'NO: 3: 
SEQUENCE CHARACTERISTICS : 

LENGTH: 1110 base pairs 
TYPE: nucleic acid 
STRANDEDNESS: single 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 1..1110 
SEQUENCE DESCRIPTION: SEQ ID NO: 3: 
US-10-077-874-3 



Query Match 95.7%; Score 1084.8; DB 14; Length 1110; 

Best Local Similarity 99.8%; Pred. No. 2.1e-302; 

Matches 1086; Conservative 0; Mismatches 2; Indels 0; Gaps 



0; 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTC C AGACT AT GAAGAT GAGT T T CT C C GCT AT CT GT GGCGT GAT TAT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 T C C C CT GT GCCT CCAGACT AT GAAGAT GAGT T T CT CCGCT AT CT GT GGC GT GAT TAT CT G 12 0 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 121 T AC C CAAAACAGT AT GAGT GGGT C CT CAT C GCAG C CT AT GT GGCTGT GTT C GT C GT GGC C 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GT CAT CCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTT CATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

Qy 4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GCAGT CAT GGAATGCAGCAGTGTGCT GCCT GAGCTAGCCAACCGCACACGGCTCTT CT CA 600 

Qy 601 GT CT GTGAT GAACGCTGGGCAGATGACCT C'i AT CCCAAGATCT AC CACAGTT GCTT CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GT C T GT GAT GAACGCT GGGCAGAT GAC CT C TAT C CCAAGAT CT AC CACAGTT GCT T CTT T 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 72 0 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 



Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 84 0 

Qy 841 CGCGCCTTCCTGGCT GAAGT GAAGC AGAT G C GT GCAC G GAGGAAGACAGC CAAGAT GCT G 900 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTCCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTAC7\ACTTC 1080 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1081 CTCAGTGG 1088 



RESULT 6 
US-10-077-874-1 

; Sequence 1, Application US/10077874 
; Publication No. US20020115155A1 
GENERAL INFORMATION: 

APPLICANT: Soppet, Daniel et al 
; TITLE OF INVENTION: Human Neuropeptide Receptor 

NUMBER OF SEQUENCES : 12 
CORRESPONDENCE ADDRESS : 

ADDRESSEE: Human Genome Sciences, Inc. 
STREET: 9410 Key West Avenue 
CITY: Rockville 
STATE: MD 
COUNTRY: USA 
ZIP: 20850 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

; OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/10/077, 874 
FILING DATE: 20-Feb-2002 
CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/462,509 
FILING DATE: 05-JUNE-1995 
ATTORNEY/AGENT INFORMATION: 
; NAME: Wales, Michele M. 

\ REGISTRATION NUMBER: 43,975 

REFERENCE/ DOCKET NUMBER: PF168P1D1 
TELECOMMUNICATION INFORMATION: 



TELEPHONE: 301-309-8504 
TELEFAX: 301-309-8439 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 1209 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE: 

NAME/KEY: CDS 
LOCATION: 1..1209 
SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
US-10-077-874-1 

Query Match 95.7%; Score 1084.8; DB 14; Length 1209; 

Best Local Similarity 99.8%; Pred. No. 2.2e-302; 

Matches 1086; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGC CT CC AGACT AT GAAGAT GAGT T T CT C C GC T AT CT GT GGCGTGATT AT CT G 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

Qy 241 ACC7VACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | |'| | I I I I I I I I | I I | | | | | | | | | 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTTyVCTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 



QY 



541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 



Db 



541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 



Qy 601 GT CT GT GAT GAAC G CT GGGC AGAT GAC CT CT ATC C CAAGAT CTAC C ACAGT T GCTTCTT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTGCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGCC 84 0 

Qy 841 CGC G C CT T CCT GGCT GAAGTGAAGCAGAT G C GT GCAC GGAGGAAGACAGC CAAGAT GCT G 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
Db 841 CGCGCCTT C CT GGCT GAAGT GAAG C AGAT GC GT GCAC GGAGGAAGACAGC CAAGAT GCT G 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 

I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1081 CTCAGTGG 1088 



RESULT 7 

US-09-828-538-23 

Sequence 23, Application US/09828538 
Patent No. US20010025031A1 
GENERAL INFORMATION: 
APPLICANT: Ellis, Catherine E . 

APPLICANT: Kwok, Cheni . , - ' 

APPLICANT: Bodsworth, Nicola J. 
APPLICANT: Halsey, Wendy 
APPLICANT: Van Horn, Stephanie 

TITLE OF INVENTION: HFGAN72 Receptor Genomic DNA and Methods 
TITLE OF INVENTION: of Use Thereof in Diagnostic Applications 
FILE REFERENCE: GH-50038-C1 
CURRENT APPLICATION NUMBER: US/09/828, 538 
CURRENT FILING DATE: 2001-04-06 
PRIOR APPLICATION NUMBER: 60/088,624 
PRIOR FILING DATE: 1998-06-08 
PRIOR APPLICATION NUMBER: 60/093,726 



; PRIOR FILING DATE: 1998-07-22 

; PRIOR APPLICATION NUMBER: 09/328,014 

; PRIOR FILING DATE: 1999-06-08 

; NUMBER OF SEQ ID NOS : 24 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 23 

LENGTH: 1564 

TYPE: DNA 

ORGANISM: HOMO SAPIENS 
US-09-828-538-23 

Query Match 95.7%; Score 1084.8; DB 9; Length 1564; 

Best Local Similarity 99.8%; Pred. No. 2.3e-302; 

Matches 1086; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 154 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 213 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 214 T C C CCTGT G C CT CCAGACTAT GAAGAT GAGTT T CT C C GCT AT CT GT GGC GC GATTAT CT G 273 

Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | 
Db 274 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 333 

Qy 181 CT GGTGGGCAACACGCT GGT CT GCCT GGCCGTGT GGCGGAACCACCACAT GAGGACAGTC 24 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 334 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 393 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 ACC7\ACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 453 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 513 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 514 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 573 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 574 GC C CT GGAC C G CT GGT AT dC CAT CT GC C AC CCACT AT T GTT CAAGAGC ACAGC C CGGC G G 633 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I 
Db 634 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 693 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 694 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 753 

Qy 601 GT CT GT GAT GAAC GCT GGGCAGAT GAC CT CT AT C C CAAGAT CTAC CACAGT T GCTT CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



754 GT CT GT GAT GAACGCTGGGCAGATGACCTCT ATCCCAAGAT CT AC CACAGTTGCTTCTTT 



813 



Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db ^ 814 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 873 



Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 874 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 933 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 934 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 993 

Qy 841 CGCGCCTT C CT GGCT GAAGT GAAGC AGAT GC GT GCACGGAG GAAGACAGC CAAGAT GCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994 CGCGCCTTCCT G GCT GAAGT GAAGC AGAT GC GT GCACGGAGGAAGACAGC CAAGAT GCT G 1053 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1054 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 1113 



Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1114 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1173 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 AC CT T CT C C CACT GGCT GGT GTAC GC CAACAGCGCT GCCAAC C C CAT CAT CT ACAACTT C 1233 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 

Db 1234 CTCAGTGG 1241 



RESULT 8 
US-09-393-696-1 

; Sequence 1, Application US/09393696 
; Publication No. US20030022277A1 
; GENERAL INFORMATION: 

; APPLICANT: Human Genome Sciences, Inc. et al. 

TITLE OF INVENTION: Human Neuropeptide Receptor 
; FILE REFERENCE: PF168P2 

; CURRENT APPLICATION NUMBER: US/09/393 , 696 

; CURRENT FILING DATE: 1999-09-10 

; EARLIER APPLICATION NUMBER: PCT/US95/05616 

; EARLIER FILING DATE: 1995-05-05 

; EARLIER APPLICATION NUMBER: US08/462,509 

; EARLIER FILING DATE: 1995-06-05 

; NUMBER OF SEQ ID NOS : 23 

; SOFTWARE: Patentln Ver. 2.0 

; SEQ ID NO 1 

LENGTH: 1209 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 

NAME/ KEY: CDS 



LOCATION: (1) . . (1209) 
US-09-393-696-1 



Query Match 95.5%; Score 1081.6; DB 10; Length 1209; 

Best Local Similarity 99.6%; Pred. No. 1.8e-301; 

Matches 1084; Conservative 0; Mismatches 4; Indels 0; Gaps 0 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCT CCAGACTATGAAGAT GAGTT T CTC CGCT ATCT GT GGC GT GAT TAT CT G 120 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TCCCCTGTGCCTC CAGACTAT GAAGAT GAGT T T CT C C GCTAT CT GT G GC GT GATT ATCT G 120 

Qy 121 TAC C CAAAAC AGT AT GAGT GGGT C CT CAT C G CAG C CTAT GT GGCT GT GT T C GT C GT GGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TAC C CAAAAC AGT AT GAGT GGGT C C T CAT C C C AGC C TAT GT GGCT GT GT T C GT CGT GGC C 180 

Qy 181 CT GGT GGGCAAC AC GCT GGT CT GCCT GGC C GT GT GGCGGAACCACCACAT GAGGAC AGT C 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I | | | | 
Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 42 0 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GCAGTCATGGAATGCTaGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 601 GTCT GT CAT GAAC GCT GGGCAGATGAC CT CTAT CC CAAGAT CTACC AC AGT TGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 721 AACCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 

Qy 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CGCGCCTT C CT GGCT GAAGT GAAGC AGAT G C GT GCAC GGAGGAAGACAGC C AAGAT GCT G 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCC7\ACCCCATCATCTACAACTTC 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 
Db 1081 CTCAGTGG 1088 



RESULT 9 

US-09-826-509-548 

; Sequence 548, Application US/09826509 
; Publication No. US20030204073A1 
; GENERAL INFORMATION: 

; APPLICANT: Lehmann-Bruinsma, Karin 
; APPLICANT: Liaw, Chen W. 
; APPLICANT: Lin, I-Lin 
; TITLE OF INVENTION: No. US20030204073Al-Endogenous , Constitutively Activated 
Known G 

TITLE OF INVENTION: Protein-Coupled Receptors 

FILE REFERENCE: AREN-207 
; CURRENT APPLICATION NUMBER: US/09/826, 509 
; CURRENT FILING DATE: 2001-04-05 
; PRIOR APPLICATION NUMBER: 60/195,747 
; PRIOR FILING DATE: 2000-04-07 

PRIOR APPLICATION NUMBER: 09/170,496 
; PRIOR FILING DATE: 1998-10-13 
c ; NUMBER OF SEQ ID NOS : 589 
; SOFTWARE: Patentln Version 2.1 
; SEQ ID NO 548 
; LENGTH: 1278 

TYPE: DNA 
; ORGANISM: Homo sapiens 
US-09-826-509-548 

Query Match 95.5%; Score 1081.6; DB 11; Length 1278; 

Best Local Similarity 99.6%; Pred. No. 1.8e-301; 

Matches 1084; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 



1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- I I I I I I I I I I 
1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 T C C C CT GT GC CT CCAGACT AT GAAGAT GAGT T T C T CCGCTAT CT GT GG CGT GATT AT CT G 120 

121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 TAC C CAAAAC AGT AT GAGTGG GT C CT C AT C G CAGCCTAT GT GGCT GT GT T C GT CGT GGC C 180 

181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 24 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I I II I I I I I I I I 
301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 4 80 

481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 11 I I I I I I I I I I I I I I I I I I I I 
481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

601 GTCTGT GAT GAACGCTGGGCAGATGACCT CT ATCCCAAGATCTACCACAGTT GCTT CTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 GT CT GT GAT GAAC GCT G GGCAGATGAC CT CT AT C C CAAGAT CT AC C AC AGT TGCTTCTTT 660 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I ill I 1 1 I I I I I I 1 1 1 I 1 1 1 1 I 1 1 1 1 1 I I I I I I I I I I I I I 1 1 I 1 1 1 I I I I I I i i I I I I I 

661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

841 CGCGCCTTCCTGGCT GAAGT GAAGCAGAT GC GT GC AC GGAGGAAGACAGC CAAGAT G CT G 900 



Db 



I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

841 C GCGCCTTCCT GGCT GAAGTGAAGCAGAT GCGT GCACGGAGGAAGACAAAAAAGAT GCT G 900 



Db 



901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 



QY 



Db 




Db 



Qy 



1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 108 0 



Qy 



Db 



1081 CTCAGTGG 1088 

I I I I I I I I 
1081 CTCAGTGG 1088 



RESULT 10 
US-09-393-696-3 

; Sequence 3, Application US/09393696 
; Publication No. US20030022277A1 
; GENERAL INFORMATION: 

; APPLICANT: Human Genome Sciences, Inc. et al . 
; TITLE OF INVENTION: Human Neuropeptide Receptor 
; FILE REFERENCE: PF168P2 

; CURRENT APPLICATION NUMBER: US/09/393, 696 

; CURRENT FILING DATE: 1999-09-10 

; EARLIER APPLICATION NUMBER: PCT/US95/05616 

; EARLIER FILING DATE: 1995-05-05 

; EARLIER APPLICATION NUMBER: US08/462,509 

; EARLIER FILING DATE: 1995-06-05 

; NUMBER OF SEQ ID NOS: 23 

; SOFTWARE : Patentln Ver. 2.0 

; SEQ ID NO 3 

LENGTH: 1110 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 
; NAME/ KEY: CDS 
; LOCATION: (1) . . (1110) 
US-09-393-696-3 

Query Match 95.0%; Score 1076. 8; DB 10; Length 1110; 

Best Local Similarity 99.4%; Pred. No. 4.3e-300; 

Matches 1081; Conservative 0; Mismatches 7; Indels 0; Gaps 0; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCG 60 

Qy 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TCCCCTGTGCCTCCAGACTATGAAGATGAGTTTCTCCGCTATCTGTGGCGTGATTATCTG 12 0 



Qy 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | J I I I I I I I I I I I I - 
Db 121 TACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCC 180 

Qy 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTC 240 

Qy 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTG 300 

Qy 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I 
Db 301 CCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAG 360 

Qy 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
.Db 361 GTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATC 420 

Qy 421 GCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGG 480 

Qy 481 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 
Db 4 81 GCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCT 54 0 

Qy 541 GCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 541 GCAGTCATGCAATCCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCA 600 

Qy 601 GTCTGTGATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CTCTGTCATGAACGCTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTT 660 

Qy 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGC 720 

Qy 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGC 780 

Qy 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

ifl I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I il l I I I I I I 
Db 781 CCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGC 840 

Qy 841 CGCGCCTTCCTGGCTG7\AGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTG 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 

Db 841 CGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCT^AGATGCTG 900 

Qy 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTT 960 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 901 ATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTCCCCATCAGCGTCCTCAATGTCCTT 960 

Qy 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

Db 961 AAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTC 1020 

Qy 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1021 ACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTC 1080 

Qy 1081 CTCAGTGG 1088 

I I I I I I I I 

Db 1081 CTCAGTGG 1088 



RESULT 11 
US-09-730-931-1 

; Sequence 1, Application US/09730931 

; Patent No, US20020064814A1 

; GENERAL INFORMATION: 

; APPLICANT: ELLIS, CATHERINE E. 

; TITLE OF INVENTION: DOG OREXIN 1 RECEPTOR 

; FILE REFERENCE: GH-70669 

; CURRENT APPLICATION NUMBER: US/09/730,931 

; CURRENT FILING DATE: 2000-12-06 

; PRIOR APPLICATION NUMBER: 60/169,373 

; PRIOR FILING DATE: 1999-12-07 

; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 1 

LENGTH: 1281 

TYPE: DNA 

ORGANISM: CANIS FAMILIARIS 
US-09-730-931-1 

Query Match 80.5%; Score 912; DB 9; Length 1281; 

Best Local Similarity 90.3%; Pred. No. 1.5e-252; 

Matches 988; Conservative 0; Mismatches 100; Indels 6; Gaps 1; 

Qy 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGATGGGGGTCCCCCCTGGCAGCAGAGAGCCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I III II I I I I I 

Db 1 ATGGAGCCCTCAGCCACCCCAGGGGCCCAGACTGGGACCCCCACCGGCGGCGGGGAGCTG 60 

Qy 61 TCCCCT GT GCCT CCAGACTAT GAAGAT GAGTTT CT CCGCT ATCT GT GGCGTGAT 114 

II II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I III 

Db 61 TCTCCGTCACTGGTGCCTCCCGACTATGAAGACGAGTTCCTGCGCTATCTGTGGCGCGAT 120 

Qy 115 TATCTGTACCCAAAACAGTATGAGTGGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTC 174 

II I I II II I I I I I I I I I I I I IT I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 121 TACCTGTACCCAAAGCAGTATGAGTGGGTCCTCATCGCTGCCTACGTGGCTGTGTTCCTA 180 

Qy 175 GTGGCCCTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGCGGAACCACCACATGAGG 234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GTGGCCCTGGTGGGCAACACGCTGGTCTGCCTGGCCGTGTGGAGGAACCACCACATGAGG 24 0 

Qy 235 ACAGTCACCAACTACTTCATTGTCAACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATC 294 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I II II III 

Db 241 AC G GT C AC CAACT AT T T CAT T GT C AAC CT GT C CCT GGCT GAT GT GCT GGT GACAGCCAT C 300 



Qy 



295 TGCCTGCCGGCCAGCCTGCTGGTGGACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTC 354 



Db 301 TGCCTCCCGGCCAGCCTGCTGGTAGACATCACTGAGTCCTGGCTCTTCGGTCATACCCTC 360 

Qy 355 TGCAAGGTCATCCCCTATCTACAGGCTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGC 414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 361 TGCAAAGTCATCCCCTACCTACAGGCCGTGTCTGTGTCGGTGGCAGTGCTGACTCTCAGC 42 0 

Qy 415 TTCATCGCCCTGGACCGCTGGTATGCCATCTGCCACCCACTATTGTTCAAGAGCACAGCC 474 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I i III 
Db 421 TTCATCGCCCTGGACCGCTGGTATGCCATCTGCCACCCGCTGTTGTTCAAGAGCACCGCC 480 

Qy 475 CGGCGGGCCCGTGGCTCCATCCTGGGCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCC 534 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
DId 481 CGGCGCGCCCGCAGCTCCATCCTGGGCATCTGGGCTGTGTCATTGGCTGTCATGGTACCT 54 0 

Qy 535 CAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTC 594 

MINIM II I I M I II I I II I I II Mill II I I II I I I I I I I I I I II I I II III 

Db 541 CAGGCTGCCGTCATGGAATGCAGCAGCGTGCTCCCTGAGCTAGCCAACCGCACCCGCCTC 600 

Qy 595 TT CT C AGT CT GT GAT GAAC GCT GGGC AGAT GAC CT CT AT C CCAAGAT CTACCACAGTT GC 654 

I I I I I II I I I I I I I I II I I II I II I II I I I I II I I I I I I II I I I I I I I I I I II I I II 

Db 601 TTCTCTGTGTGTGATGAACACTGGGCAGATGACCTCTATCCCAAGATCTACCACAGTTGC 660 

Qy 655 TTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATA 714 

II II I I I II II I II I I I I II II I I I II I I II I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 661 TTCTTCATTGTCACCTACTTGGCCCCACTGGGCCTCATGGCCATGGCCTATTTCCAGATC 720 

Qy 715 TTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACCACCTCAGCACTGGTGCGGAACTGG 774 

I II II II II I II I II I I I I I I I II I I I I I I I I II I I I II II I I I I I I I I I I I I I I 
Db 721 TTCCGCAAGCTCTGGGGCCGCCAGATCCCTGGCACCACATCGGCCCTGGTGAGGAACTGG 78 0 

Qy 775 AAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCC 834 

I I I I I I II I I I I II II I I II I I I II I I I I MINIM! I I I I || II 

Db 781 AAGCGGCCCTCGGACCAGCTGGAGGACCAGGGGCCCGGCCTGAGCGCGGAACCCCCCCCT 840 

Qy 835 CGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAG 894 

II I I III I I I I I I I I II II II I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I 

Db 841 CGGGCCCGGGCCTTCCTGGCTGAGGTGAAGCAGATGCGAGCGCGGAGGAAGACGGCCAAG 900 

Qy 895 ATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAAT 954 

II I I II I M I II I I I I I I I I II I II I I I I I I I II I I I II I I I I I I II I I II I I I I I I 
Db 901 ATGCTGATGGTGCTGCTGCTGGTCTTTGCCCTCTGCTACCTGCCCATCAGTGTCCTCAAT 960 

Qy 955 GTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCC 1014 

II II I II II II I I I I I I I I I II I I II I II II I I I I II I I I I I I I II I I I M I I M 
Db 961. Glt^CT CAAGAG GGT GT T C G GGAT GT T C C GC CAAT C C AGT GAC C GAGAAGC C CT oT AC GC C 1020 

Qy 1015 TGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAACAGCGCTGCCAACCCCATCATCTAC 1074 

I I II I II II I II I II I II I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I 

Db 1021 TGCTTCACCTTCTCCCACTGGCTGGTGTATGCCAACAGCGCTGCCAACCCCATCATCTAC 1080 

Qy 1075 AACTTCCTCAGTGG 1088 

II II I II I II I II 

Db 1081 AACTTCCTCAGCGG 1094 



RESULT 12 



US-10-278-087A-55 

/Sequence 55, Application US/10278087A 
; Publication No. US20030138817A1 
GENERAL INFORMATION: 

APPLICANT: Shuji Hinuma 
; Yasuaki Ito 

; Ryo Fujii 

; TITLE OF INVENTION: G Protein Coupled Receptor Protein, 

; Production, And Use Thereof 

NUMBER OF SEQUENCES: 61 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Edwards & Angell, LLP 

; STREET: 101 Federal Street 

; CITY: BOSTON 

STATE: MA 

COUNTRY: USA 

ZIP: 02209 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentln Release #1.0, Version #1.25 (EPO) 

; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/10/278 , 087A 
; FILING DATE: 31-Jan-2003 

; CLASSIFICATION: <Unknown> 

PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 09/461,436 

FILING DATE: 14-DEC-1999 

APPLICATION NUMBER: 09/038,572 

FILING DATE: ll-MAR-1998 

APPLICATION NUMBER: 08/513,974 

FILING DATE: 14-SEP-1995 

APPLICATION NUMBER: PCT/JP95/ 01599 

FILING DATE: 10-AUG-1995 

APPLICATION NUMBER: 7-093989 
; FILING DATE: 19-APR-1995 

; APPLICATION NUMBER: 7-057186 

; FILING DATE: 16-MAR-1995 

; APPLICATION NUMBER: 7-007177 

FILING DATE: 20-JAN-1995 

APPLICATION NUMBER: 6-326611 

FILING DATE: 28-DEC-1994 

APPLICATION NUMBER: 6-270017 

FILING DATE: 02-NOV-1994 

APPLICATION NUMBER: 6-236357 

FILING DATE: 30-SEP-1994 

APPLICATION NUMBER: 6-236356 

FILING DATE: 30-SEP-1994 

APPLICATION NUMBER: 6-189274 

FILING DATE: ll-AUG-1994 

APPLICATION NUMBER: 6-189273 
; FILING DATE: ll-AUG-1994 

; APPLICATION NUMBER: 6-189272 

FILING DATE: ll-AUG-1994 
ATTORNEY/AGENT INFORMATION: 
; NAME: CONLIN, DAVID G. 



REGISTRATION NUMBER: <Unknown> 

REFERENCE/ DOCKET NUMBER: 457 53 DIV3 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: 617-439-4444 

TELEFAX: 617-439-4170 
INFORMATION FOR SEQ ID NO: 55: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 789 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 

SEQUENCE DESCRIPTION: SEQ ID NO: 55: 
US-10-278-087A-55 

Query Match 59.2%; Score 670.6; DB 15; Length 789; 

Best Local Similarity 90.6%; Pred. No. 5.4e-183; 

Matches 715; Conservative 0; Mismatches 74; Indels 0; Gaps 0; 



Qy 271 GCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGGACATCACTGAG 330 

II M M I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
Db 1 GCCGATGTGCTGGTGACAGCCATCTGCCTGCCGGCCAGTCTGCTGGTAGACATCACGGAA 60 

Qy 331 TCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGGCTGTGTCCGTG 390 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TCCTGGCTCTTTGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGGCCGTGTCCGTG 120 

Qy 391 T CAGT GGCAGTGCT AACTCT CAGCTT CAT CGCCCT GGACCGCT GGT AT GC CAT CT GCCAC 450 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 TCAGTGGTCGTGCTGACTCTCAGCTCCATCGCCCTGGACCGCTGGTACGCCATCTGCCAC 180 

Qy 451 CCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGGGCATCTGGGCT 510 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 

Db 181 CCGCTGTTGTTCAAGAGCACTGCCCGGCGCGCCCGCGGCTCCATCCTCGGCATCTGGGCG 24 0 

Qy 511 GTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCAGTGTGCTGCCT 570 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
Db 241 GTGTCGCTGGCTGTCATGGTGCCTCAGGCTGCTGTCATGGAGTGTAGCAGCGTGCTGCCC 300 

Qy 571 GAGCT AGC CAAC C GCACAC GGCT CTT CT CAGT CT GT GAT GAACGCT GGGCAGAT GAC CT C 630 

I I I I I I I I I I I I I I I I II III I II I I I I I I I I I I I I I I I I I II II I I I I II 

Db 301 GAGCTGGCCAACCGCACCCGCCTCCTGTCTGTCTGTGATGAGCGCTGGGCAGACGACCTG 360 

Qy 631 TATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCCCACTGGGCCTC 690 

II I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TACCC'CAAGATCTACCACAGCTGCTTCTTCATTGTCACCTACCTGGCCCCACTGGG&TC 420 

Qy 691 ATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGATCCCCGGCACC 750 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AT GGC CAT G GC CT ATT T C C AGAT CTTC CGCAAGCT CT GGG GC C GC CAGAT C C C C G GC ACC 4 80 

Qy 751 ACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGGACCTGGAGCAG 810 

I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 4 81 ACCTCGGCCCTGGTGCGCAACTGGAAGCGGCCCTCAGACCAGCTGGACGACCAGGGCCAG 54 0 

Qy 811 GGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAGTGAAGCAGATG 870 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I II I I I I I I I I I I I 



Db 



541 GGCCTGAGCTCAGAGCCCCAGCCCCGGGCCCGCGCCTTCCTGGCCGAGGTGAAACAGATG 600 



Qy 871 CGTGCACGGAGGAAGACAGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGC 930 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 601 CGAGCCCGGAGGAAGACGGCCAAGATGCTGATGGTGGTGCTGCTGGTCTTCGCCCTCTGC 660 

Qy 931 TACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGTTCCGCCAAGCC 990 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 TACCTGCCCATCAGTGTCCTCAACGTCCTCAAGAGGGTCTTCGGGATGTTCCGCCAAGCC 720 

Qy 991 AGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAAC 1050 

II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 AGCGACCGAGAGGCCATCTACGCCTGCTTCACCTTCTCCCACTGGCTGGTGTACGCCAAC 780 

Qy 1051 AGCGCTGCC 1059 

I I I I I I I I 
Db 781 AGCGCCGCC 789 



RESULT 13 
US-10-282-717-1 

; Sequence 1, Application US/10282717 
; Publication No. US20030083466A1 
; GENERAL INFORMATION: 
; APPLICANT: YANAG I S AWA , MASASHI 

; TITLE OF INVENTION: cDNA CLONE MY1 THAT ENCODES A NOVEL 
; TITLE OF INVENTION: HUMAN 7 -TRANSMEMBRANE RECEPTOR 
; FILE REFERENCE: GH50029D1C1 

; CURRENT APPLICATION NUMBER: US/ 10/2 82 , 717 

; CURRENT FILING DATE: 2002-10-28 

; PRIOR APPLICATION NUMBER: 09/676,625 

; PRIOR FILING DATE: 2000-10-02 

; PRIOR APPLICATION NUMBER: 09/119,788 

; PRIOR FILING DATE: 1998-07-21 

; PRIOR APPLICATION NUMBER: 60/053,790 

; PRIOR FILING DATE: 1997-07-25 

; NUMBER OF SEQ ID NOS : 2 

SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 1 
; LENGTH: 1633 
; TYPE: DNA 

; ORGANISM: HOMO SAPIENS 
US-10-282-717-1 

Query Match 46.0%; Score 520.8; DB 15; Length 1633; 

Best Local Similarity 70.5%; Pred. : , No. le-139; 

Matches 712; Conservative 0; Mismatches 292; Indels 6; Gaps 1; 



Qy 80 AT GAAGAT GAGTT T CT C C GCT AT CT GT GGC GT GAT T AT CT GTAC C C AAAACAGTAT GAGT 139 

I II II II II II II II I I I I I I I II II III I I I I I II I I I I I I I I 
Db 217 AC GAC GAG GAAT T C CT GC GGT AC C T GT GGAGG GAAT ACCT GCACCCGAAAGAAT AT GAGT 276 

Qy 140 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 277 GGGTCCTGATCGCCGGGTACATCATCGTGTTCGTCGTGGCTCTCATTGGGAACGTCCTGG 336 

Qy 200 TCTGCCTGGCCGT GT GG C GGAAC C AC C AC AT GAGGACAGT CACCAACTACTT CATT GT CA 259 



I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 337 T T T GTGT GGCAGT GT GGAAGAAC C ACCAC ATGAG GAC G GTAACCAACT ACT T CAT AGT C A 396 

Qy 2 60 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I II II I I I I I I I I II II I I I I I I II I I I I II I I I I Ml I I I I I 

Db 397 ATCTTTCTCTGGCTGATGTGCTCGTGACCATCACCTGCCTTCCAGCCACACTGGTCGTGG 456 

Qy 320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 379 

I I I I I I I I I I I I I I I I II II II I I I I I I I I I II II II MINIMI 
Db 457 AT ATCACT GAGAC CT GGTTT T T T GGACAGTC C CT T T G CAAAGT GAT T C CT T AT CTACAGA 516 

Qy 380 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I I I I I I I I III I II II II II I I I I I I I I I I I I I I II I I I I I II 
Db 517 CCGTGTCGGTGTCTGTGTCTGTCCTCACACTGAGCTGTATCGCCTTGGATCGGTGGTATG 57 6 

Qy 440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 4 99 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 577 C AATCT GT C AC C CTTT GAT GT T T AAGAGC ACAGCAAAGC GGGC C C GTAACAGCAT T GT CA 636 

Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I I I I I I I I I I I I II II I I M M II I I I I I I I I I I I I I I I I 

Db 637 T CAT CT GGAT T GT CT CCTGC AT T AT AAT GATT C CT C AG GC CAT C GT C AT GGAGT GC AGC A 696 

Qy 560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 697 CCGTGTTCCCAGGCTTAGCCAATAAAACCACCCTCTTTACGGTGTGTGATGAGCGCTGGG 756 

Qy 62 0 CAGATGACCTCTATCCCAAGATCTACCACAGTTGCTTCTTTATTGTCACCTACCTGGCCC 679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 757 GT G GT GAAAT T TAT C C C AAG AT GT AC C AC AT CTGTTTCTTTCTGGT GAC AT AC AT GG C AC 816 

Qy 680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

I I I II I I I I I I I I I I I I III I II I I I II I I I I I II I I I I I II I I I I 
Db 817 C ACT GT GT CT C AT G GTGT T G GCT T AT CT GCAAAT AT T T CGCAAACT CT GGT GT CGAC AGA 876 

Qy 74 0 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 877 T CCCT GGAACAT CATCTGTAGTTCAGAGAAAAT GGAAGCCCC TGCAGCCTGTTT 930 

Qy 800 ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

II I III I I I I II I I I I I I I I I I I I I I I 

Db 931 CACAGCCTCGAGGGCCAGGACAGCCAACGAAGTCCCGGATGGGCGCTGTGGCGGCTGAAA 990 

Qy 8 60 TGAAGCAGATGCGTGCACGGAGGAAGACAGCCAAGATGCTGATGGTGGTGCTGGTGGTCT 919 

I I I I I I I I I I I I I I I I I I I I I I I I I M M II II M I II I M I I I I I 
Db 931 TAAAGCAGAT CCGAGCCAGAAGGAAAACAGCCCGGATGTTGAT GGTT G ± tiCTTTTGGTAT 1050 

Qy 920 TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 979 

I II I Mill II II II III I I I I I I I I I I II I I I II II II I I I I I I I 
Db 1051 TTGCAATTTGCTATCTACCAATTAGCATCCTCAATGTGCTAAAGAGAGTATTTGGGATGT 1110 

Qy 98 0 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1111 T T GC CCAT ACT GAAGAC AGAGAGACT GT GT AT GC CT GGTTT AC CT T T T C ACACT GGCT T G 1170 



Qy 1040 TGTACGCCAACAGCGCTGCCAACCCCATCATCTACAACTTCCTCAGTGGA 1089 

I II Mill II II I I I II II II II M II M I I I II I I I I 



Db 1171 TATAT GC CAAT AGT G CT GCGAAT C CAAT T ATT T ATAATTTT CT C AGT GGA 1220 



RESULT 14 

US-10-225-567A-369 

; Sequence 369,. Application US/10225567A 
; Publication No. US20030113798A1 
; GENERAL INFORMATION: 

APPLICANT: Lifespan Biosciences 
; APPLICANT: Brown, Joseph P. 
; APPLICANT: Burner, Glenna C. 
; APPLICANT: Roush, Christine L. 

; TITLE OF INVENTION: ANTIGENIC PEPTIDES AND ANTIBODIES FOR G PROTEIN-COUPLED 

RECEPTORS (GPCRS) 

; FILE REFERENCE: 1920-4-4 

; CURRENT APPLICATION NUMBER: US/10/225, 567A 
; CURRENT FILING DATE: 2001-12-19 

PRIOR APPLICATION NUMBER: 60/257,144 

PRIOR FILING DATE: 2000-12-19 
; NUMBER OF SEQ ID NOS : 2292 

SOFTWARE: Patent In version 3.1 
; SEQ ID NO 369 

LENGTH: 1843 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-225-567A-369 

Query Match 46.0%; Score 520.8; DB 15; Length 1843; 

Best Local Similarity 70.5%; Pred. No. le-139; 

Matches 712; Conservative 0; Mismatches 292; Indels 6; Gaps 1 



Qy 80 AT GAAGAT GAGT T T CT C CGCTAT CT GT GG C GT GATT ATCT GT AC C CAAAACAGT AT GAGT 139 

' I II II II II II II II I I I I I I I II II III I I I I III I I I I I I I I 
Db 428 ACGACGAGGAATT CCTGCGGTACCT GT GGAGGGAATACCTGCACCCGAAAGAATAT GAGT 487 

Qy 14 0 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II III I I I I 

Db 488 GGGTCCTGATCGCCGGGTACATCATCGTGTTCGTCGTGGCTCTCATTGGGAACGTCCTGG 547 

Qy 200 TCTGCCTGGCCGTGTGGCGGAACCACCACATGAGGACAGTCACCAACTACTTCATTGTCA 259 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I 
Db 54 8 TTTGT GTGGCAGT GT GGAAGAACCACCACAT GAGGACGGTAACCAACTACTT CATAGTCA 607 

Qy 260 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 

Db 608 ATCTTTCTCTGGCTGATGTGCTCGTGACCATCACCTGCCTTCCAGCCACACTGGTCGTGG 667 

Qy 320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 37 9 

I I I I I I I I I I I I I I I I II II II I I II I I I I I II II II I I I I I I I I 
Db 668 AT AT CACT GAGAC CT GGT TTTTT GGACAGT C C CT TT GCAAAGT GAT T C CT T AT CT ACAGA 727 

Qy 380 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I I I I I I I I III I II II II II I I I I I I II II I I I I II I I I I I I I 
Db 728 CCGTGTCGGTGTCTGTGTCTGTCCTCACACTGAGCTGTATCGCCTTGGATCGGTGGTATG 787 

Qy 440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 



Db 788 CAATCTGTCACCCTTTGATGTTTAAGAGCACAGCAAAGCGGGCCCGTAACAGCATTGTCA 8 47 

Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 84 8 TCATCTGGATTGTCTCCTGCATTATAATGATTCCTCAGGCCATCGTCATGGAGTGCAGCA 907 

Qy 560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I > I I I I I I I I I I I I II I I I I I I I I I I I II II 

Db 908 CCGTGTTCCCAGGCTTAGCCAATAAAACCACCCTCTTTACGGTGTGTGATGAGCGCTGGG 967 

Qy 620 C AGAT GAC CT CT AT C C CAAGAT CT AC CAC AGT TGCTTCTT TAT T GT C AC CTACCT GGCCC 679 

I I I I I I I I I I I I I I III I I I I I I I I I I I I 

Db 968 GT G GT GAAAT T TAT C C CAAGAT GT AC CAC AT CTGTTTCTTTCTGGT GAC AT AC AT G GCAC 1027 

Qy 680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 

I I I I I I I I I I I I I I I I I I I II I I I I I I I II 

Db 102 8 CACTGTGTCTCATGGTGTTGGCTTATCTGCAAATATTTCGCAAACTCTGGTGTCGACAGA 1087 

Qy 74 0 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 108 8 T CCCT GGAACAT CAT CT GT AGTT CAGAGAAAAT GGAAGCCCC TGCAGCCTGTTT 1141 

Qy 8 00 ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

II I III I I I I I I I I I I I I I I I I I I I I I 

Db 1142 CACAGCCTCGAGGGCCAGGACAGCCAACGAAGTCCCGGATGAGCGCTGTGGCGGCTGAAA 1201 

Qy 860 T GAAGC AGAT GC GT G C AC GGAG GAAGACAGC CAAGAT GCT GAT GGT GGT GCTGCTGGTCT 919 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 12 02 TAAAGCAGAT C C GAG C CAGAAG GAAAAC AGC C C GGAT GT T GAT G GTT GT GCTTTTG GTAT 1261 

Qy 920 TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 979 

I II I I I I I I II II II III I I I I I I I I I I II I I I II II II I I I I I I I 
Db 1262 TT G CAAT T T GCT AT CT AC C AAT T AGCAT C CT CAAT GT GCTAAAGAGAGTATTT GGGATGT 1321 

Qy 98 0 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1322 TTGCCCATACTGAAGACAGAGAGACTGTGTATGCCTGGTTTACCTTTTCACACTGGCTTG 1381 

Qy 104 0 T GT AC GCCAAC AGC GCT GCCAAC C C CAT C AT CT ACAACTT CCT CAGT GGA 1089 

I II I I II I II I I I I I II II II II II II II I I I I I I I I I 
Db 1382 TAT AT GC CAAT AGT GCT G CGAAT C CAATT ATT T AT AAT TTT CTCAGT GGA 1431 



RESULT 15 
US-09-826-509-550 

7 Sequence 550, Application US/09826509 
; Publication No. US20030204073A1 
; GENERAL INFORMATION: 

APPLICANT: Lehmann-Bruinsma , Karin 
; APPLICANT: Liaw, Chen W. 
; APPLICANT: Lin, I-Lin 

; TITLE OF INVENTION: No. US20030204073Al~Endogenous, Constitutively Activated 
Known G 

; TITLE OF INVENTION: Protein-Coupled Receptors 
; FILE REFERENCE: AREN-2 07 

; CURRENT APPLICATION NUMBER: US/09/ 82 6 , 509 
; CURRENT FILING DATE: 2001-04-05 



; PRIOR APPLICATION NUMBER: 60/195,747 

; PRIOR FILING DATE: 2000-04-07 

; PRIOR APPLICATION NUMBER: 09/170,496 

; PRIOR FILING DATE: 1998-10-13 

; NUMBER OF SEQ ID NOS : 5 89 

; SOFTWARE: Patentln Version 2.1 

; SEQ ID NO 550 

; LENGTH: 1335 

TYPE: DNA 
; ORGANISM: Homo sapiens 
US-09-826-509-550 

Query Match 45.5%; Score 516; DB 11; Length 1335; 

Best Local Similarity 70.2%; Pred. No. 2.3e-138; 

Matches 7 09; Conservative 0; Mismatches 295; Indels 6; Gaps 1; 

Qy 80 AT GAAGAT GAGT T T CT C C GCT AT CT GT GGCGTGATT AT CT GT AC C CAAAACAGT AT GAGT 139 

I II II II II II II II I I I I I I I II II III I I I I III I I I I I I I I 
Db 104 AC GAC GAGGAAT T C C T GC GGT AC CT GT GGAGGGAAT ACCTGC AC C C GAAAGAAT AT GAGT 163 

Qy 140 GGGTCCTCATCGCAGCCTATGTGGCTGTGTTCGTCGTGGCCCTGGTGGGCAACACGCTGG 199 

I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 164 GGGTCCTGATCGCCGGGTACATCATCGTGTTCGTCGTGGCTCTCATTGGGAACGTCCTGG 223 

Qy 200 T CTGC CT GGC C GT GT GG C GGAAC CAC CACAT GAGGAC AGT CACCAACT ACTT CAT T GT C A 259 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I 
Db 224 TTT GT GT GGC AGT GT GGAAGAAC CAC CACAT GAGGACGGTAAC CAACT ACT T CAT AGT C A 2 83 

Qy 260 ACCTGTCCCTGGCTGACGTTCTGGTGACTGCTATCTGCCTGCCGGCCAGCCTGCTGGTGG 319 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 284 ATCTTTCTCTGGCTGATGTGCTCGTGACCATCACCTGCCTTCCAGCCACACTGGTCGTGG 343 

Qy 320 ACATCACTGAGTCCTGGCTGTTCGGCCATGCCCTCTGCAAGGTCATCCCCTATCTACAGG 37 9 

I I I I I I I I I I I I I II I II II II I I I I I I I I I II II II I I I I I I I I I 
Db 344 ATATCACTGAGACCTGGTTTTTTGGACAGTCCCTTTGCAAAGTGATTCCTTATCTACAGA 403 

Qy 380 CTGTGTCCGTGTCAGTGGCAGTGCTAACTCTCAGCTTCATCGCCCTGGACCGCTGGTATG 439 

I I I I I I I I I I I III I II II II II I I I I I I I I I I I I I I II I I I I I I I 
Db 404 CCGTGTCGGTGTCTGTGTCTGTCCTCACACTGAGCTGTATCGCCTTGGATCGGTGGTATG 463 

Qy 440 CCATCTGCCACCCACTATTGTTCAAGAGCACAGCCCGGCGGGCCCGTGGCTCCATCCTGG 4 99 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III I 
Db 464 CAAT CT GT CAC C CT T T GAT GT T TAAGAGCACAGCAAAGCGGGC C C GT AAC AGC ATT GT CA 523 

Qy 500 GCATCTGGGCTGTGTCGCTGGCCATCATGGTGCCCCAGGCTGCAGTCATGGAATGCAGCA 559 

I I I I I IT III II I I I I I I I I I I I II I I I I I I I I I I I I In 

Db 524 T CAT CT GGAT T GT CT C CT GC ATT ATAAT GATT CCT CAGGC CAT C GT CAT GGAGT GC AGC A 58 3 

Qy 560 GTGTGCTGCCTGAGCTAGCCAACCGCACACGGCTCTTCTCAGTCTGTGATGAACGCTGGG 619 

I I I I I I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I I 

Db 584 CCGTGTTCCCAGGCTTAGCCAATAAAACCACCCTCTTTACGGTGTGTGATGAGCGCTGGG 643 

Qy 620 CAGAT GACCT CT AT C C CAAGAT CT ACCAC AGTT GCTT CTT T AT T GT CAC CT AC CT GGC C C 67 9 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 644 GT GGT GAAAT T TAT C C CAAGAT GT AC CACAT CT GTTT CTTT CT GGT GACAT AC AT GGC AC 7 03 

Qy 680 CACTGGGCCTCATGGCCATGGCCTATTTCCAGATATTCCGCAAGCTCTGGGGCCGCCAGA 739 



1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 III I II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I II 1 1 1 1 

•Db 704 CACTGTGTCTCATGGTGTTGGCTTATCTGCAAATATTTCGCAAACTCTGGTGTCGACAGA 763 ■ 

Qy 74 0 TCCCCGGCACCACCTCAGCACTGGTGCGGAACTGGAAGCGCCCCTCAGACCAGCTGGGGG 799 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

Db 7 64 T CCCT GGAAC AT CAT CT GTAGT T C AGAGAAAATGGAAGC C C C TGCAGCCTGTTT 817 

Qy 8 00 ACCTGGAGCAGGGCCTGAGTGGAGAGCCCCAGCCCCGGGGCCGCGCCTTCCTGGCTGAAG 859 

III III I I I I I I I I I II I I I I I I I I II 

Db 818 CACAGCCTCGAGGGCCAGGACAGCCAACGAAGTCCCGGATGAGCGCTGTGGCGGCTGAAA 877 

Qy 860 T GAAG CAGAT GC GT GCACGGAG GAAGACAGCCAAGAT G C T GAT GGT GGT GCT GC T GGT CT 919 

I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 

Db 878 T AAAGC AGAT C C GAGC CAGAAGGAAAACAAAAC G GAT GT T GAT GGTTGTGCTTTTG GT AT 937 

Qy 920 TCGCCCTCTGCTACCTGCCCATCAGCGTCCTCAATGTCCTTAAGAGGGTGTTCGGGATGT 979 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 938 TT GCAAT T T GCTAT CT ACCAAT TAG CAT C CT CAAT GT GCTAAAGAGAGTATTT G G GAT GT 997 

Qy 980 TCCGCCAAGCCAGTGACCGCGAAGCTGTCTACGCCTGCTTCACCTTCTCCCACTGGCTGG 1039 

I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 998 TTGCCCATACTGAAGACAGAGAGACTGTGTATGCCTGGTTTACCTTTTCACACTGGCTTG 1057 

Qy . 1040 T GT ACGCCAACAGCG CT GCCAAC C C CAT CAT CTACAACT T C CT C AGT GGA 1089 

I II I II I I II I I I I I II II II II II II II I I I I I I I I I 
Db 1058 T AT AT GC CAAT AGT GC TGCGAAT C CAAT TAT T TAT AAT T T T CT CAGT GGA 1107 
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